麦粉社区
>
帖子详情

具体如何使用文本数据源

数据挖掘 发表于 2020-3-12 17:06
发表于 2020-3-12 17:06:19
请问,要怎么使用文本数据源,上面说的hdfs文件的格式应该怎么弄?(想使用自己的数据进行数据挖掘)哪位大佬可以解答,感激不尽!
发表于 2020-3-13 10:44:20
格式如下
hdfs://10.10.202.26:9000/data/mllib/UnitTest_data/UnitTest1M.csv

其中hdfs://10.10.202.26:9000 是hdfs name node 的url/data/mllib/UnitTest_data/UnitTest1M.csv 是具体文件的hdfs 路径

  1. [root@master ~]# hadoop fs -ls /data/mllib/UnitTest_data/UnitTest1M.csv
  2. -rw-r--r--   1 root supergroup    1077593 2019-04-16 16:00 /data/mllib/UnitTest_data/UnitTest1M.csv
  3. [root@master ~]#
复制代码


回复

使用道具 举报

发表于 2020-3-13 11:33:22
yaojialuo 发表于 2020-3-13 10:44
格式如下
hdfs://10.10.202.26:9000/data/mllib/UnitTest_data/UnitTest1M.csv

不太懂代码,没有接触过hdfs。可以再详细教学下吗?这个需要下载什么软件?安装后怎么使用,要在哪里打这些代码?怎么把自己的Excel表格数据转换成思迈特软件能支持的hdfs的csv格式?可以讲解下吗,万分感谢!
回复

使用道具 举报

发表于 2020-3-15 17:59:31
hdfs数据源需要现场本地构造有hdfs系统才行。普通使用直接将csv文件通过本地“文件”数据源上传到系统中http://wiki.smartbi.com.cn:18081 ... ion?pageId=44499509。在数据挖掘的试验中,选择“关系数据源”即可。
回复

使用道具 举报

发表于 2020-3-16 10:47:05
Jaylin 发表于 2020-3-15 17:59
hdfs数据源需要现场本地构造有hdfs系统才行。普通使用直接将csv文件通过本地“文件”数据源上传到系统中htt ...

懂了,感谢!
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

4回帖数 0关注人数 2783浏览人数
最后回复于:2020-3-16 10:47
快速回复 返回顶部 返回列表