什么是hadoop
- hadoop是apache旗下的一套开源软件平台
- hadoop提供的功能,利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理
- hadoop的核心组件有:
- HDFS(分布式文件系统)
- YARN(运算资源调度系统)
- MapReduce(分布式运算编程框架)
- 广义上,hadoop通常是指一个更广泛的概念–hadoop生态圈
常用命令参数介绍
- ls
功能:显示目录信息
示例:hadoop fs -ls /wordcount/input
- mkdir
功能:创建目录
示例:hadoop fs -mkdir -p /aaa/bbb/cc
- moveFromLocal
功能:从本地剪切粘贴到hdfs
示例:hadoop fs -moveFromLocal /home/hadoop/a.txt /aaa/bbb/cc
- moveToLocal
功能:从hdfs剪切粘贴到本地
示例:hadoop fs -moveToLocal /aaa/bbb/cc /home/hadoop/a.txt
- appendToFile
功能:追加一个文件到已经存在的文件末尾
示例:hadoop fs -appendToFile ./hello.txt /hello.txt
- cat
功能:查看文件内容
示例:hadoop fs -cat /hello.txt
- tail
功能:查看文件尾部几行
示例:hadoop fs tailf /hello.txt | more
- text
功能:以字符形式打印一个文件的内容
示例:hadoop fs -text /hello.txt
- chgrp chmod chown
功能:与linux文件系统的用法一样,操作文件所属权限
示例:hadoop fs -chmod 666 /hello.txt
- copyFromLocal copyToLocal
功能:用法与moveToLocal moveFromLocal 用法一致
- cp
功能:从hdfs的一个路径拷贝到另一个路径
示例:hadoop fs -cp /aaa/from.txt /bbb/to.txt
- mv
功能:从hdfs的一个路径移动另一个路径
示例:hadoop fs -mv /aaa/from.txt /
- get
功能:等同于copyToLocal,就是从hdfs下载文件到本地
示例:hadoop fs -get /aaa/from.txt
- getmerge
功能:合并下载多个文件
示例:hadoop fs -getmerge /aaa/log.*
- put
功能:等同于copyFromLocal
示例:hadoop fs -put /aaa/from.txt /bbb/to.txt
- rm
功能:删除文件或文件夹
示例: hadoop fs -rm -r /aaa/bbb/
- rmdir
功能:删除kongmulu
示例:hadoop fs -rmdir /aaa/bbb
- df
功能:统计文件系统的可用空间信息
示例:hadoop fs -df -h /
- du
功能:统计文件夹的大小信息
示例:hadoop fs -du -s -h /
- count
功能:统计一个指定目录下的文件节点数量
示例:hadoop fs -count /
- setrep
功能:设置hdfs中文件的副本数量
示例: hadoop fs -setrep 3 /aaa/hello.txt