网路互联-第104页

08 11月

kafka中文教程学习记录首先准备好linux机器环境，参考此篇文章：快速搭建Linux服务器环境单机版1. 下载代码https://kafka.apache.org/downloads.html官方的下载链接比较慢，这里可以使用第三方下载转发的链接地址...

作者:admin|分类:大数据|浏览:1073

08 11月

sqoop 导出hive数据到MySQL数据库当中

常用命令：查看hive中表的结构： desc table_name;查看hive中表的详细结构：desc formatted table_name;我们想要将hive表中的数据导出到MySQL当中，MySQL中必须要有一个表来接收，并且该表的结构...

作者:admin|分类:大数据|浏览:848

08 11月

Python+Pandas：快速连接各种常用数据库满足你的一切常用需求

在大数据时代下，和数据打打交道是家常便饭。那么常用储存数据的一种方式：数据库，用起来那也是相当的得心应手，今天就用python连接各类常见数据库！常用数据库1.sqlite2.mysql3.postgresql4.mongodb5.redis6.hive7...

作者:admin|分类:大数据|浏览:951

08 11月

Flink学习记录--入门篇

前言流式计算可能在日常不多见，主要统计一个阶段内的PV、UV，在风控场景很常见，比如统计某个用户一天内同地区下单总量来判断该用户是否为异常用户。还有一些大数据处理场景，如将某一段时间生成的日志按需要加工后倒入到存储DB中做查询报表。为什么要学习Flink，...

作者:admin|分类:大数据|浏览:875

08 11月

大数据SPARK系列篇-1个经典的入门实例(单词统计功能)

大数据SPARK系列篇-1个经典的入门实例(单词统计功能基于SCALA语言 sparkContext.textFile(“hdfs://hadoopNode1:8000/data/word.txt” .flatMap{_.split(" &qu...

作者:admin|分类:大数据|浏览:733

08 11月

安装Hadoop

实验概述：1. 配置Hadoop主从服务2. 配置服务器ssh免登录3. 验证Hadoop安装成功实验目的：通过该实验后，可以独立安装配置Hadoop集群环境实验背景：本实验中会分配到三台装有Centos 7的服务器，请将其中的一台选定为主服务器(name...

作者:admin|分类:大数据|浏览:789

08 11月

大数据技能竞赛之Spark搭建（五）

以下操作除特殊说明外都在三个节点上操作。注意：操作前务必使三台虚拟机可以互相免密通信！一、安装Scala软件包使用xftp将软件包上传至三台虚拟机的/usr/package文件夹下创建工作目录mkdir -p /usr/scala解压缩...

作者:admin|分类:大数据|浏览:773

06 11月

完全分布式Hadoop2.X的搭建

准备工作：安装jdk 克隆2台虚拟机完成后：新的2台虚拟机，请务必依次修改3台虚拟机的ip地址和主机名称【建议三台主机名称依次叫做：master、node1、node2 】（虚拟机的克隆，...

作者:admin|分类:大数据|浏览:836

06 11月

[Apache Atlas] Atlas 架构设计及源代码简单分析

Apache Atlas 架构设计及源代码分析, 以Hive建库为例,分析元数据采集的主体流程...

作者:admin|分类:大数据|浏览:1030

06 11月

完全分布式Hadoop3.X的搭建

准备工作以及安装Hadoop之前的操作和Hadoop2.X的安装相同，在我上一篇博客中，这里不做过多介绍 https://www.cnblogs.com/lmandcc/p/15306163.html...

作者:admin|分类:大数据|浏览:985

‹‹ ‹ 100 101 102 103 104 105 106 107 108 109 › ››

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

搜索

网站分类

控制面板: 您好，欢迎到访网站！
登录后台查看权限

友情链接

一互联服务社

站点信息

文章总数:3202
页面总数:0
分类总数:10
标签总数:59
评论总数:2
浏览总数:14978375

↑