博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
mahout 安装
阅读量:4693 次
发布时间:2019-06-09

本文共 751 字,大约阅读时间需要 2 分钟。

1. 下载mahout-distribution-0.5.tar.gz 并解压;

2.配置环境变量: /etc/profile

export MAHOUT_HOME=/home/mahout/export PATH=$MAHOUT_HOME/bin:$PATH

3. 启动hadoop 

start-all.sh

4. mahout -help 测试

5. kmeans测试:

(1)下载一个文件synthetic_control.data,下载地址http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data。

(2)创建测试目录testdata,并把数据导入到这个tastdata目录中(这里的目录的名字只能是testdata)

hadoop@ubuntu:~$ hadoop fs -mkdir testdata #hadoop@ubuntu:~$ hadoop fs -put /home/hadoop/mahout-distribution-0.7/synthetic_control.data testdata

(3)使用kmeans算法

hadoop@ubuntu:~/$ hadoop jar mahout/mahout-examples-0.5-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

(4) 查看结果

hadoop@ubuntu:~/$ hadoop fs -lsr output

  

 

转载于:https://www.cnblogs.com/kennethshu/p/3833936.html

你可能感兴趣的文章
什么是“闭包”(closure)为什么要用它?
查看>>
log4j2简单使用
查看>>
wget使用小技巧
查看>>
学霸修炼的秘籍
查看>>
Duplicate 复制数据库 搭建Dataguard
查看>>
Java导入execl
查看>>
Js中的window.parent ,window.top,window.self 详解
查看>>
next
查看>>
数据库---表---多表查询
查看>>
【分享】常用获取IP及地区信息API
查看>>
Spring 【引用】类型【注入】
查看>>
正则表达式 环视
查看>>
关于Tchar
查看>>
小白学习Spark系列三:RDD常用方法总结
查看>>
将jquery序列化转成对象的编码坑
查看>>
6.824 LAB1 环境搭建
查看>>
shell 脚本实战笔记(10)--spark集群脚本片段念念碎
查看>>
HDU - 3572 Task Schedule
查看>>
log4j2.xml的例子
查看>>
1004 四子连棋
查看>>