How can i output hadoop result in csv format(如何以 csv 格式输出 hadoop 结果)
问题描述
我需要以 .csv 格式输出我的 hadoop 结果.我将如何做到这一点?我的代码:https://github.com/studhadoop/xml/blob/master/XmlParser11.java
I need to output my hadoop result in .csv format. how will i do this? My code :https://github.com/studhadoop/xml/blob/master/XmlParser11.java
我是否应该在我的代码中简单地包含 csvoutputFormat.我正在使用 mapreduce API
should i simply include csvoutputFormat in my code. I am using mapreduce API
我的工作.sh
bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita Vidyalayam, Karwar_Class 1 B_ENG.xml /user/root/ala_xmlrpt-outputshell4
bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit
cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv
解决方案
是我失踪了>在猫
cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv
推荐答案
可以使用TextOutputFormat.默认的键/值分隔符是制表符.您可以通过在驱动程序中设置属性mapred.textoutputformat.separatorText"来更改分隔符.
You can use TextOutputFormat. The default key/ value separator is a tab character. You can change the separator by setting the property "mapred.textoutputformat.separatorText" in your driver.
conf.set("mapred.textoutputformat.separatorText", ",");
这篇关于如何以 csv 格式输出 hadoop 结果的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:如何以 csv 格式输出 hadoop 结果
基础教程推荐
- 设置 bean 时出现 Nullpointerexception 2022-01-01
- Java:带有char数组的println给出乱码 2022-01-01
- 减少 JVM 暂停时间 >1 秒使用 UseConcMarkSweepGC 2022-01-01
- 在 Libgdx 中处理屏幕的正确方法 2022-01-01
- “未找到匹配项"使用 matcher 的 group 方法时 2022-01-01
- 无法使用修饰符“public final"访问 java.util.Ha 2022-01-01
- Java Keytool 导入证书后出错,"keytool error: java.io.FileNotFoundException &拒绝访问" 2022-01-01
- FirebaseListAdapter 不推送聊天应用程序的单个项目 - Firebase-Ui 3.1 2022-01-01
- 如何使用 Java 创建 X509 证书? 2022-01-01
- 降序排序:Java Map 2022-01-01