hadoop集群搭建
|
0 评论
一、发行版本​Hadoop发行版本分为开源社区版和商业版,社区版是指由Apache软件基金会维护的版本,是官方维护的版本体系。商业版Hadoop是指由第三方商业公司在社区版Hadoop基础上进行了一些修改、整合以及各个服务组件兼容性测试而发行的版本,比较著名的有cloudera的CDH、mapR等。
centOS7上编译hadoop-2.7.7
|
0 评论
阅读编译文档在hadoop源码包根目录下有个一个BUINDING.txt的文件,文件说明了编译hadoop所需要的一些编译hadoop所需要的一些编译环境相关的东西。不同hadoop版本的要求都不一样。我选择的版本是hadoop-2.7.7Requirements:* Unix System* JD
python多版本管理工具(pyenv)
|
0 评论
在学习和利用python开发的很多情况下,需要多版本的Python并存。此时需要在系统中安装多个Python,但又不能影响系统自带的 Python。pyenv 就是这样一个 Python 版本管理器。一、 pyenv介绍项目地址:https://github.com/pyenv/pyenv简单的说,
Pyinstaller (python打包为exe文件)
|
0 评论
pandas
|
0 评论
pandas的常用数据类型1. Series一维,带标签数组2. DataFrame二维,Series容器pandas之Series创建In [15]: a = {string.ascii_uppercase[i]:i for i in range(10)}# 字典推导式创建一个字典aIn [16]
numpy
|
0 评论
什么是numpy一个在python中做科学计算的基础库,重在数值计算,也是大部分PYTHON科学计算库的基础库,多用于大型、多维数组上执行数值运算numpy创建数组(矩阵)创建数组:import numpy as npa = np.array([1, 2, 3, 4, 5])b = np.array
matplotlib
|
0 评论
为什么要学习matplotlib能将数据进行可视化,更直观的呈现使数据更加客观、更具说服力matplotlib:最流行的Python底层绘图库,主要做数据可视化图表,名字取材MATLAB,模仿MATLAB构建matplotlib基本要点每个红色的点是坐标,把5个点的坐标连接成一条线,组成了一个折线图
pymongo的操作
|
mongo备份恢复
|
0 评论
mongodb索引
|
0 评论