大数据工具部署（大数据工具部署流程）

金生 05-25 98

默认

摘要： Hive3.1.2+大数据引擎Tez0.9.2安装部署到使用测试(踩坑详情)1、依据官网指引编译Tez0.1版本（以Tez0.2为例，适用于相同版本号的读者直接下载编译成果）。...

Hive3.1.2+大数据 引擎Tez0.9.2安装 部署到使用 测试(踩坑详情)

1、依据官网指引编译Tez0.1版本（以Tez0.2为例，适用于相同版本号的读者直接下载编译成果）。对Hive进行Tez配置，注意校验 jar包路径，以及确认正确放置tez-site.xml文件至指定目录。测试结果显示Tez引擎运行正常，可在YARN环境中查看任务状态。

FineBI6.0安装部署(最新版)

1、首先，从提供的下载链接获取最新版.exe文件，建议在Windows 系统下以管理员权限运行安装。启动安装程序，按照提示进行安装，包括接受协议、选择安装位置、设置附加功能等步骤。安装过程中可能需要几分钟时间，完成后复制之前获取的激活码。

2、案例一：员工考勤打卡时间统计设想有一组员工考勤数据，目标是统计员工每日最早打卡时间和最晚打卡时间，而无需修改原表结构。传统做法是通过分组汇总功能，但这可能导致字段遗漏。利用DEF函数，我们可以轻松实现这一需求。

3、借助FineBI等工具，企业可加速数据驱动决策进程。市面上众多数据分析软件，选择需考虑实际需求。目前，帆软BI软件（FineBI）在企业数据分析BI软件市场中占有显著份额。

4、FineBI v1版本终于发布，经过长达六个月的研发测试，它带来了令人期待的新功能。这个版本旨在解决以往版本中的性能瓶颈和用户体验问题。首先，1版本引入了存算分离的全新架构，自助数据集的更新性能提升了100%。

5、在节省成本方面，FineBI同样表现出色。通过一次性的安装部署，企业可以统一数据标准，避免了因使用多个商业智能系统而产生的重复评估、购买、布局、实施和维护的成本浪费。这不仅简化了企业的IT基础设施，还降低了整体运营成本。更重要的是，FineBI能够帮助企业进行预测分析和智能决策。

6、操作系统 cpu JDK8及以上Windows 32位 OracleWindows 64位 Oraclelinux 32位 OracleLinux 64位 OracleLinux 64位 IBM J9OS X 64位 Oracle在安装前需确认当前操作系统的CPU及对应JDK版本、厂商，JDK版本必须为8及以上，可去对应厂商处下载JDK版本安装部署，否则将无法正确安装。

大数据环境部署时的本地源问题

本地源部署涉及C/S架构，其中C端（服务器）通过配置yum地址实现软件下载，而S端（本地源服务器）负责管理软件包并提供http服务。1 安装本地源管理工具本地源管理工具用于创建软件仓库并管理其中的内容。安装命令为：`yum install createrepo -y`（root用户或使用sudo权限）。

安装部署HADOOP大数据集群在CDH管理工具中选择安装版本，进行集群安装。配置主机和组件，先只安装hdfs和hive，后续可增加其他组件。进行节点分配，连接 MySQL库，进行hdfs设置，等待安装完成。至此，Hadoop集群安装完成。

所有集群节点开启NTP服务，以保证时间同步。关闭防火墙和SELinux以优化系统环境。安装依赖包，包括bigtop和必要的Python 模块，以及重新安装gcc。制作本地yum源：制作本地yum源，以便下载Ambari、HDP和相关组件的安装包。安装Apache HTTP服务器：从指定目录下载Ambari 0和HDP0.3资源。

首先，私有化部署，也称私有云，是企业拥有并管理的云环境，可以部署在内部数据中心或安全的托管场所。其优点在于更精细的控制和数据安全性，但成本较高。内部私有云由企业内部运营，外部私有云则由第三方管理。

配置本地yum源：安装Apache HTTPD，上传ambari、HDP文件并解压，配置本地源repo文件，验证yum源可用性。安装java和Mysql：根据系统版本卸载旧版本JDK，上传新版本JDK并配置环境变量。安装Mysql，创建ambari数据库及用户，若需安装Hive、Oozie，创建相应数据库和用户，安装Mysql JDBC驱动。

部署大数据解决方案的第一步是数据提取，即从各种来源提取数据。数据源可以是像Salesforce这样的CRM，像SAP这样的企业资源规划系统，像MySQL这样的RDBMS或任何其他日志文件，文档，社交媒体源等。数据可以通过批处理作业或实时流来提取。然后将提取的数据存储在HDFS中。