转载 · Centos7.6+Hadoop 3.1.2(HA)+Zookeeper3.4.13+Hbase1.4.9(HA)+Hive2.3.4+Spark2.4.0(HA)高可用集群搭建

2019-06-08

原博文作者：迦壹

原博客地址：Centos7.6+Hadoop 3.1.2(HA)+Zookeeper3.4.13+Hbase1.4.9(HA)+Hive2.3.4+Spark2.4.0(HA)高可用集群搭建

转载 · Centos7.6+Hadoop 3.1.2(HA)+Zookeeper3.4.13+Hbase1.4.9(HA)+Hive2.3.4+Spark2.4.0(HA)高可用集群搭建

目录

[TOC]

1、前言
1.1、什么是 Hadoop?
1.1.1、什么是 YARN?
1.2、什么是 Zookeeper?
1.3、什么是 Hbase?
1.4、什么是 Hive
1.5、什么是 Spark?
2、环境准备
2.1、网络配置
2.2、更改 HOSTNAME
2.3、配置 SSH 免密码登录登录
2.4、关闭防火墙
2.7、安装 NTP
3. 下载应用程序及配置环境变量
3.1、创建安装目录
3.2、下载本文中用到的程序
3.3、设置环境变量
4. 安装 Oracle JDK 1.8.0
4.1 下载 Oracle JDK 1.8.0
4.2、配置 Oracle JDK 1.8.0
5、安装 Zookeeper3.4.13
5.1、修改配置文件 zoo.cfg
5.2、为每台服务器创建身份标识
5.3、在所有节点中启动 zookeeper
5.4、查看zookeeper 运行状态
5.5、测试 Zookeeper 是否启动成功
6、安装 Hadoop3.1.2
6.1、修改 Hadoop 配置文件
6.1.1、修改配置文件 core-site.xml
6.1.2、修改配置文件 hdfs-site.xml
6.1.3、修改配置文件 mapred-site.xml
6.1.4、修改配置文件 capacity-scheduler.xml
6.1.5、修改配置文件 yarn-site.xml
6.1.6、编辑 start-dfs.sh，stop-dfs.sh 脚本
6.1.7、编辑 start-yarn.sh，stop-yarn.sh 脚本
6.1.8、修改配置文件 works 文件
6.2、启动 Hadoop
6.2.1、启动JournalNode集群
6.2.2、格式化 NameNode
6.2.3、启动 zookeeper 故障转移控制器
6.2.4、格式化 zookeeper
6.2.5、启动 NameNode
6.2.6、将 NameNode 数据复制到备用 NameNode
6.2.7、启动 HDFS 进程
6.2.8、测试 HDFS 是否可用
6.2.9、启动 YARN
6.2.10、测试 YARN 的可用性
6.2.11、查看 MapReduce 运行的历史记录
6.2.12、验证 Hadoop HA 高可用性
7、安装 Hbase 1.4.9
7.1、修改 Hbase 配置文件
7.1.1、编辑配置文件 hbase-env.sh
7.1.2、编辑配置文件 hbase-site.xml
7.1.3、配置 Slaver
7.1.4、将 Hbase 复制到其他机器
7.2、启动 Hbase
7.2.1、用 Shell 测试连接 Hbase
7.2.2、测试 Hbase 故障转移
8、安装 Mysql 5.7
8.1、启动 Mysql
8.2、授权可以远程访问 Mysql
8.3、修改 Mysql 授权远程访问
9、安装 Hive2.3.4
9.1、修改 Hive配置文件
9.1.1、编辑配置文件 hive-env.sh
9.1.2、编辑配置文件 hive-site.xml
9.1.3、下载 Mysql 驱动
9.2、启动 Hive
9.2.1、初始化 MySql 数据库
9.2.2、创建测试数据，以及在hadoop上创建数据仓库目录
9.2.3、用 Shell 测试连接 Hive
9.2.4、Hive to Hbase
9.2.5、Hbase to Hive
10、安装 Spark 2.4.0
10.1、修改 Spark 配置文件
10.1.1、编辑配置文件 spark-env.sh
10.1.2、编辑配置文件 Slaves
10.2、启动spark集群
10.2.1、将 Spark 和 Scala 复制到其他机器
10.2.2、启动 Spark
10.2.3、测试 Spark 集群
10.2.4、运行 Spark on YARN
11、常见问题
11.1、Hbase
11.1.1、You have version null and I want version 8. Is your hbase.rootdir valid? If so, you may need to run 'hbase hbck -fixVersionFile'
12. 参考资料

more >>

展开全文 >>

Windows10搭建本地mysql-yum源

2019-05-23

以下操作可在wsl中进行

同步索引信息

mysql 8

1
2
3

mkdir -p mysql8/repodata
cd mysql8/repodata
lftp "https://mirrors.tuna.tsinghua.edu.cn/mysql/yum/mysql80-community-el7/repodata/" -e "mirror --verbose -P 5 --delete --only-missing; bye"

mysql 5.7

1
2
3

mkdir -p mysql57/repodata
cd mysql57/repodata
lftp "https://mirrors.tuna.tsinghua.edu.cn/mysql/yum/mysql57-community-el7/repodata/" -e "mirror --verbose -P 5 --delete --only-missing; bye"

获取最新的版本号

mysql 8

mysql8_version=$(lftp https://mirrors.tuna.tsinghua.edu.cn/mysql/yum/mysql80-community-el7/ -e "cls;bye" | grep -e "mysql-community-client.*.el7.x86_64.rpm" | sed -r 's/mysql-community-client-(.*).el7.x86_64.rpm/\1/g' | sort -rV |  xargs | awk -F ' ' '{print $1}')

mysql 5.7

mysql57_version=$(lftp https://mirrors.tuna.tsinghua.edu.cn/mysql/yum/mysql57-community-el7/ -e "cls;bye" | grep -e "mysql-community-client.*.el7.x86_64.rpm" | sed -r 's/mysql-community-client-(.*).el7.x86_64.rpm/\1/g' | sort -rV |  xargs | awk -F ' ' '{print $1}')

more >>

展开全文 >>

网易云音乐每日推荐歌曲页面显示评论数

2019-05-03

效果：

每日歌曲推荐

1. 安装Tampermonkey扩展

2. 新建脚本

3. 将如下代码粘贴至编辑器内，按Ctrl+S保存，或者直接在Greasy Fork安装我发布的脚本

// ==UserScript==
// @name         网易云音乐显示评论数
// @version      1.0
// @namespace    https://greasyfork.org/zh-CN/users/297892
// @description  网易云音乐每日歌曲推荐界面显示评论数
// @author       移影残风
// @match        http*://music.163.com/*
// @require      https://cdn.bootcss.com/jquery/3.3.1/jquery.min.js
// @grant        none
// ==/UserScript==

(function () {
    'use strict';
    window.onload = function () {
        console.log('网易云音乐每日歌曲推荐界面显示评论数')
        //console.log('iframe:' + $("iframe")[0].contentWindow.$(".txt:eq(2) a").attr('href').split('id=')[1])
        //console.log('iframe:' + $("iframe")[0].contentWindow.$(".txt:eq(2) a b").attr('title'))
        $("iframe")[0].contentWindow.$("thead tr").append('<th><div style="padding: 8px 10px;">评论数</div></th>')

        for (let i = 0; i <= 29; i++) {
            let selector = ".txt:eq(" + i + ") a";
            let musicId = $("iframe")[0].contentWindow.$(selector).attr('href').split('id=')[1]
            let selector2 = ".txt:eq(" + i + ")";
            let url = "https://music.163.com/api/v1/resource/comments/R_SO_4_" + musicId + "?limit=20&offset=0";
            $.get(url, function (data) {
                let jsonObj = JSON.parse(data);
                let commentCount = jsonObj.total;
                $("iframe")[0].contentWindow.$(selector2).parents("tr").append('<td class=""><div class="f-cb"><div class="tt"><div class="ttc"><span>'+commentCount+'</span></div></div></div></td>')

            })
        }
    }
})();

直接点安装即可

展开全文 >>

linux 获取最新版本git并编译安装

2019-04-25

1.安装依赖

Git 的工作需要调用 curl，zlib，openssl，expat，libiconv 等库的代码，所以需要先安装这些依赖工具。在有 yum 的系统上（比如 Fedora）或者有 apt-get 的系统上（比如 Debian 体系），可以用下面的命令安装：

1
2
3

yum install curl-devel expat-devel gettext-devel openssl-devel zlib-devel -y

sudo apt-get install libcurl4-gnutls-dev libexpat1-dev gettext libz-dev libssl-dev -y

2.获取最新版本

1	git_version=$(lftp https://mirrors.ustc.edu.cn/kernel.org/software/scm/git/ -e "cls;bye" \| grep -e "git-[0-9]..tar.gz" \| sed -r 's/git-(.).tar.gz/\1/g' \| sort -rV \| xargs \| awk -F ' ' '{print $1}')

more >>

展开全文 >>

缺失模块。
1、请确保node版本大于6.2
2、在博客根目录（注意不是yilia根目录）执行以下命令：
npm i hexo-generator-json-content --save

3、在根目录_config.yml里添加配置：

  jsonContent:
    meta: false
    pages: false
    posts:
      title: true
      date: true
      path: true
      text: false
      raw: false
      content: false
      slug: false
      updated: false
      comments: false
      link: false
      permalink: false
      excerpt: false
      categories: false
      tags: true

很惭愧<br><br>只做了一点微小的工作<br>谢谢大家