mahout 安装-白红宇

mahout 安装

阅读量：4693 次

发布时间：2019-06-09

本文共 751 字，大约阅读时间需要 2 分钟。

1. 下载mahout-distribution-0.5.tar.gz 并解压；

2.配置环境变量： /etc/profile

export MAHOUT_HOME=/home/mahout/export PATH=$MAHOUT_HOME/bin:$PATH

3. 启动hadoop

start-all.sh

4. mahout -help 测试

5. kmeans测试：

（1）下载一个文件synthetic_control.data，下载地址http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data。

（2）创建测试目录testdata，并把数据导入到这个tastdata目录中(这里的目录的名字只能是testdata)

hadoop@ubuntu:~$ hadoop fs -mkdir testdata #hadoop@ubuntu:~$ hadoop fs -put /home/hadoop/mahout-distribution-0.7/synthetic_control.data testdata

（3）使用kmeans算法

hadoop@ubuntu:~/$ hadoop jar mahout/mahout-examples-0.5-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

（4）查看结果

hadoop@ubuntu:~/$ hadoop fs -lsr output

转载于:https://www.cnblogs.com/kennethshu/p/3833936.html

你可能感兴趣的文章

什么是“闭包”（closure）为什么要用它？

Duplicate 复制数据库搭建Dataguard

查看>>

Java导入execl

查看>>

Js中的window.parent ,window.top,window.self 详解

小白学习Spark系列三：RDD常用方法总结

shell 脚本实战笔记(10)--spark集群脚本片段念念碎

查看>>

HDU - 3572 Task Schedule