為什麼詞頻統計找不到文件
㈠ 詞頻統計 問題描述:從標准輸入流(文件流)輸入若干文本行,統計每個單詞出現的頻數。
實現關鍵點:
去除非字母字元(assii碼)
大寫統一轉小寫;
然後開始統計詞頻。
代碼如下請參考:
#include<iostream>
#include<fstream>
#include<string>
#include<map>
using namespace std;
string bd;
struct ll
{
string str;
int times;
};
ll aa[500];
int cishu=0;//列表裡的不同詞的數量
void save_file()//打開文件,讀取文件
{
ifstream outfile("詞頻統計文件.txt",ios::in);
if(!outfile)
{
cerr<<"打開文件錯誤"<<endl;
exit(1);
}
while(!outfile.eof())
{
getline(outfile,bd);
}
outfile.close();
}
void delete_fh()//去除標點符號
{
int i=0;
while(i<bd.size())
{
if(bd[i]==',' || bd[i]=='.')
if(i<bd.size()-2)
bd=bd.substr(0,i)
+wz.substr(i+2,bd.size()-i-2);//前面的是遇到符號的句子+後
面的句子連接起來。逗號去除,把句子連接起來
else
bd=bd.substr(0,i);
i++;
}
}
void change()//變成小寫字母
{
int i=0;
while(i<bd.size())
{
if(isupper(bd[i]))
bd[i]=bd[i]+32;
i++;
}
}
//把數據放在臨時字元串與結構列表中判斷,如果在結構列表
//中有就加1,如果沒禪基有就添在結構表裡。
void add_a_word(string tmp)//向列表裡加入詞
{
int c;
for(c=0;c<cishu;c++)//遍歷詞表
{
if(aa[c].str==tmp)//找到了
{
aa[c].times++;//次數+1
break;
}
}
if(c==cishu)//列表裡沒有該詞
{
aa[c].str=tmp;//把詞加入列表
aa[c].times=1;//出現次數=1
cishu++;//總次數+1
}
}
void count1()//查找一個空格的單詞
{
int i=0;
int a=0;
int j=0;
int n=0;
string tmp;
while(i<bd.size())
{
if(bd[i]==' ')
{
tmp=bd.substr(a,i-a);
add_a_word(tmp);
a=i+1;
}
i++;
}
}
void count2()//查找倆個空槐改格的單詞
{
string tmp1,tmp2,tmp3;
int i=0;
int a=0;
int c=0;
int s=0;
while(i<bd.size())
{
if(bd[i]==' ')
{
tmp1=bd.substr(a,i-a);
a=i+1;
c=i+1;
while(c<bd.size())
{
if(wz[c]==' ')
{
tmp2=wz.substr
(i+1,c-i-1);
break;
}
c++;
}
if(c==bd.size())
// tmp2=bd.substr
(i+1,bd.size()-i-1);
break;
tmp3=tmp1+' '+tmp2;
add_a_word(tmp3);
i=c;
continue;
}
i++;
}
//for( s=0;s<cishu;s++)
// {
// cout<<aa[s].str<<" "<<aa
[s].times<<endl;
//鉛襲判 }
}
void over_file()//寫文件
{
int s;
fstream outfile("output.txt",ios::out);
if(!outfile)
{
cerr<<"open error"<<endl;
exit(1);
}
for(s=0;s<cishu;s++)
{
outfile<<aa[s].str<<" "<<aa
[s].times<<endl;
//cout<<aa[s].str<<" "<<aa[s].times<<endl;
}
outfile.close();
}
int main(){
save_file();
delete_fh();
change();
count1();
count2();
over_file();
return 0;
㈡ 怎樣將詞頻統計的文本和python文件保存在同一個文件夾裡面
你是要保存文件嗎?用with open。
with open('蠢宏要寫入的路徑名', 'w') as f:#w表族殲示write
f.write('需要寫入帶穗冊的內容')
㈢ python詞頻統計找不到文件
1、首首姿螞先打開電腦找到屬性冊配。
2、其次點擊左側「高級者埋系統設置」,選擇「高級」點擊「環境變數」。
3、最後點擊「新建」,將python安裝進去就找到了。
㈣ eclipse中maprece沒有文件
hadoop三節點配置方案
pass
eclipse配置maprece
配置前的准備
下載相關文件
注意:箭頭所指的ppt可下載下來進行對照配置,方框所指的文件為後續所需要的文件。
啟動eclipse並添加maprece插件
1.在Windows中解壓eclipse-java-2019-03-R-linux-gtk-x86_64.tar.gz
並確定文件內容是否完整
2.將eclipse文件夾拖入centos中(最好放在桌面)並確認文件夾內容是否完整
注意:之所以.eclipseproct沒看到,是因為以.開頭的文件為隱藏文件
3.將事先下載好的hadoop-eclipse-plugin-2.6.0.jar文件拖入eclipse文件夾的dropins文件夾中
4.運行eclipse
[root@master eclipse]# ./eclipse
登錄後復制
注意:箭頭所指的地方,用默認已出現的路徑就ok
5.添加maprece插件
並添加hadoop的路徑
注意:/usr/local/src/hadoop為個人hadoop路徑
6.添加maprece項目
雙擊下方圖像中箭頭所指的插件名稱
下方箭頭所指的文件名可以隨便取
7.打開maprece的窗口
可以看到maprece窗口
8.啟動master節點(一個就好)
注意:記得用root賬戶執行該命令
jps查看運行結果
9.使用eclipse連接節點
添加前,首先關閉hadoop裡面關於hdfs的安全檢查
修改為下列代碼
接下來,便是添加連接
1:隨便寫的名字
2:主機的名字,也可以寫127.0.0.1
3:固定寫50070
4:參考hadoop目錄下etc/hadoop/目錄下的core-site.xml文件中的<value>hdfs://master:9000</value>
5:user name為hadoop運行時的許可權用戶
10.載入完後,my hadoop會載入出之前創建的input、output文件夾
如果沒有,建議打開終端執行以下兩條命令(記得用root執行命令)
[root@master hadoop]# hdfs dfs -mkdir /input
[root@master hadoop]# hdfs dfs -mkdir /output
登錄後復制
之所以這里報錯,是因為我已經創建了這個文件夾
創建wordcount項目
前提:Windows中的文件能夠直接復制粘貼到改中centos中
點擊WordCount.java,右擊復制
返回虛襲centos中,進入eclipse,進行粘貼
修改WordCount.java
1.刪除該串代碼
2.修改該串代碼
修改後:
上傳dream.txt
將事先下載到windows中的dream.txt復制到centos桌面
使用終端上傳至hadoop中
[root@master Desktop]# hdfs dfs -put dream.txt /input/dream.txt
登錄後復制
刷新eclipse的my Hadoop節點,查看文件
運行WordCount.java
點擊進入WordCount.java,並進行下圖操作
配置輸入輸出文件
將log4j.properties復制到src中
完成
復制hadoop路徑下的etc/hadoop路徑下的core-site.xml、hdfs-site.xml到src中
運行WordCount.java
完成
檢驗是否成功,可查看output文件是差殲兄否生成對應的文檔
hadoop
maprece
0套路,限時0元領,105G絕版通用流量卡,資費永久29
中國聯通
廣告
eclipse運行maprece的插件
5下載·0評論
2018年6月14日
eclipse配置maprece全教程
2294閱讀·0評論·4點贊
2019年10月31日
MapRece編程入門--用eclipse創建MapRece工程
2804閱讀·0評論·1點贊
2021年10月22日
Mac下eclipse的Hadoop開發環境配置中以及windows->preferences下看不到Hadoop/MapRece的配置項問題解決
1077閱讀·0評論·4點贊
2021年10月23日
eclipse開發MapRece
804閱讀·0評論·1點贊
2018年12月22日
Hadoop——MapRece相關eclipse配置及Api調用(圖文超詳細版)(內含遇到錯誤的解決方法)
2888閱讀·4評論·9點贊
2021年11月10日
Hadoop+eclipse運行MapRece程序
1342閱讀·0評論·0點贊
2015年11月24日
hadoop-eclipse-plugin-2.2.0.jar放到eclipse的plugins文件夾後,eclipse中沒有map/rece項
5359閱讀·0評論·1點贊
2014年6月26日
無需安裝虛擬機,Windows本地環境下使用Eclipse通過Hadoop進行MapRece
867閱讀·0評論·1點贊
2022年5月6日
Eclipse下編寫hadoop的MapRece程序
672閱讀·0評論·0點贊
2019年4月28日
在Eclipse中實現MapRece過程
870閱讀·0評論·1點贊
2019年6月14日
調用MapRece對文件中各個單詞出現次數進行統計
864閱讀·0評論·5點贊
2020年12月6日
Eclipse開發maprece程序環境搭建
3007閱讀·1評論·4點贊
2019年8月30日
在Eclipse中運行第一個MapRece程序
1736閱讀·0評論·0點贊
2011年12月12日
Eclipse本地運行MapRece
650閱讀·0評論·0點贊
2018年6月3日
使用eclipse寫maprece程序,然後打包程序到集群運行
259閱讀·0評論·1點贊
2021年12月1日
使用Hadoop以及Eclipse平台,創建Hadoop項目——編寫簡單MapRece程序,運行MapRece詞頻統計程序,查看詞頻統計程序的結果。
2873閱讀·0評論·0點贊
2022年4月29日
eclipse+MapRece
41閱讀·0評論·0點贊
2016年8月26日
Hadoop(MapRece)入門 使用Eclipse開發
1.0W閱讀·1評論·5點贊
2017年2月9日
在eclipse上搭建maprece開發環境及運行wordcount
9853閱讀·0評論·0點贊
2017年2月8日
去首頁
看看更多熱門內容
㈤ 如何做詞頻統計
1.先說中文詞頻統計,網上有不少半成品的軟體或工具,如ROST系列ROSTCM6,ROST WordParser等,還有MyZiCiFreq及Excel版本神碼的「詞頻分析工具@Excel大全」,除此之外其他免費的詞頻統計軟體基本就是花瓶。
2.這搏悔些軟體都可以在網上下載下來。
3.其中,Rostcm6功能強大,但可惜已經不再更新。excel版本的詞頻統計功能簡潔明了,容易上手。
4.由於目前這些免費的中文詞頻基瞎正統計軟體大都只能統計TXT文本文檔,所以如果手頭是PDF之類文件的話,需要先PDF轉TXT,這時候需要一些工具或技巧,可以到網路經驗中搜索具體辦法。
㈥ hadoop詞頻統計失敗
伺服器連接失敗。hadoop詞頻統計失敗是伺服器連含伏接失敗導致,談斗攜需要重新連接伺服器銷盯。Hadoop是一個由Apache基金會所開發的分布式系統基礎架構。