为什么词频统计找不到文件
㈠ 词频统计 问题描述:从标准输入流(文件流)输入若干文本行,统计每个单词出现的频数。
实现关键点:
去除非字母字符(assii码)
大写统一转小写;
然后开始统计词频。
代码如下请参考:
#include<iostream>
#include<fstream>
#include<string>
#include<map>
using namespace std;
string bd;
struct ll
{
string str;
int times;
};
ll aa[500];
int cishu=0;//列表里的不同词的数量
void save_file()//打开文件,读取文件
{
ifstream outfile("词频统计文件.txt",ios::in);
if(!outfile)
{
cerr<<"打开文件错误"<<endl;
exit(1);
}
while(!outfile.eof())
{
getline(outfile,bd);
}
outfile.close();
}
void delete_fh()//去除标点符号
{
int i=0;
while(i<bd.size())
{
if(bd[i]==',' || bd[i]=='.')
if(i<bd.size()-2)
bd=bd.substr(0,i)
+wz.substr(i+2,bd.size()-i-2);//前面的是遇到符号的句子+后
面的句子连接起来。逗号去除,把句子连接起来
else
bd=bd.substr(0,i);
i++;
}
}
void change()//变成小写字母
{
int i=0;
while(i<bd.size())
{
if(isupper(bd[i]))
bd[i]=bd[i]+32;
i++;
}
}
//把数据放在临时字符串与结构列表中判断,如果在结构列表
//中有就加1,如果没禅基有就添在结构表里。
void add_a_word(string tmp)//向列表里加入词
{
int c;
for(c=0;c<cishu;c++)//遍历词表
{
if(aa[c].str==tmp)//找到了
{
aa[c].times++;//次数+1
break;
}
}
if(c==cishu)//列表里没有该词
{
aa[c].str=tmp;//把词加入列表
aa[c].times=1;//出现次数=1
cishu++;//总次数+1
}
}
void count1()//查找一个空格的单词
{
int i=0;
int a=0;
int j=0;
int n=0;
string tmp;
while(i<bd.size())
{
if(bd[i]==' ')
{
tmp=bd.substr(a,i-a);
add_a_word(tmp);
a=i+1;
}
i++;
}
}
void count2()//查找俩个空槐改格的单词
{
string tmp1,tmp2,tmp3;
int i=0;
int a=0;
int c=0;
int s=0;
while(i<bd.size())
{
if(bd[i]==' ')
{
tmp1=bd.substr(a,i-a);
a=i+1;
c=i+1;
while(c<bd.size())
{
if(wz[c]==' ')
{
tmp2=wz.substr
(i+1,c-i-1);
break;
}
c++;
}
if(c==bd.size())
// tmp2=bd.substr
(i+1,bd.size()-i-1);
break;
tmp3=tmp1+' '+tmp2;
add_a_word(tmp3);
i=c;
continue;
}
i++;
}
//for( s=0;s<cishu;s++)
// {
// cout<<aa[s].str<<" "<<aa
[s].times<<endl;
//铅袭判 }
}
void over_file()//写文件
{
int s;
fstream outfile("output.txt",ios::out);
if(!outfile)
{
cerr<<"open error"<<endl;
exit(1);
}
for(s=0;s<cishu;s++)
{
outfile<<aa[s].str<<" "<<aa
[s].times<<endl;
//cout<<aa[s].str<<" "<<aa[s].times<<endl;
}
outfile.close();
}
int main(){
save_file();
delete_fh();
change();
count1();
count2();
over_file();
return 0;
㈡ 怎样将词频统计的文本和python文件保存在同一个文件夹里面
你是要保存文件吗?用with open。
with open('蠢宏要写入的路径名', 'w') as f:#w表族歼示write
f.write('需要写入带穗册的内容')
㈢ python词频统计找不到文件
1、首首姿蚂先打开电脑找到属性册配。
2、其次点击左侧“高级者埋系统设置”,选择“高级”点击“环境变量”。
3、最后点击“新建”,将python安装进去就找到了。
㈣ eclipse中maprece没有文件
hadoop三节点配置方案
pass
eclipse配置maprece
配置前的准备
下载相关文件
注意:箭头所指的ppt可下载下来进行对照配置,方框所指的文件为后续所需要的文件。
启动eclipse并添加maprece插件
1.在Windows中解压eclipse-java-2019-03-R-linux-gtk-x86_64.tar.gz
并确定文件内容是否完整
2.将eclipse文件夹拖入centos中(最好放在桌面)并确认文件夹内容是否完整
注意:之所以.eclipseproct没看到,是因为以.开头的文件为隐藏文件
3.将事先下载好的hadoop-eclipse-plugin-2.6.0.jar文件拖入eclipse文件夹的dropins文件夹中
4.运行eclipse
[root@master eclipse]# ./eclipse
登录后复制
注意:箭头所指的地方,用默认已出现的路径就ok
5.添加maprece插件
并添加hadoop的路径
注意:/usr/local/src/hadoop为个人hadoop路径
6.添加maprece项目
双击下方图像中箭头所指的插件名称
下方箭头所指的文件名可以随便取
7.打开maprece的窗口
可以看到maprece窗口
8.启动master节点(一个就好)
注意:记得用root账户执行该命令
jps查看运行结果
9.使用eclipse连接节点
添加前,首先关闭hadoop里面关于hdfs的安全检查
修改为下列代码
接下来,便是添加连接
1:随便写的名字
2:主机的名字,也可以写127.0.0.1
3:固定写50070
4:参考hadoop目录下etc/hadoop/目录下的core-site.xml文件中的<value>hdfs://master:9000</value>
5:user name为hadoop运行时的权限用户
10.加载完后,my hadoop会加载出之前创建的input、output文件夹
如果没有,建议打开终端执行以下两条命令(记得用root执行命令)
[root@master hadoop]# hdfs dfs -mkdir /input
[root@master hadoop]# hdfs dfs -mkdir /output
登录后复制
之所以这里报错,是因为我已经创建了这个文件夹
创建wordcount项目
前提:Windows中的文件能够直接复制粘贴到改中centos中
点击WordCount.java,右击复制
返回虚袭centos中,进入eclipse,进行粘贴
修改WordCount.java
1.删除该串代码
2.修改该串代码
修改后:
上传dream.txt
将事先下载到windows中的dream.txt复制到centos桌面
使用终端上传至hadoop中
[root@master Desktop]# hdfs dfs -put dream.txt /input/dream.txt
登录后复制
刷新eclipse的my Hadoop节点,查看文件
运行WordCount.java
点击进入WordCount.java,并进行下图操作
配置输入输出文件
将log4j.properties复制到src中
完成
复制hadoop路径下的etc/hadoop路径下的core-site.xml、hdfs-site.xml到src中
运行WordCount.java
完成
检验是否成功,可查看output文件是差歼兄否生成对应的文档
hadoop
maprece
0套路,限时0元领,105G绝版通用流量卡,资费永久29
中国联通
广告
eclipse运行maprece的插件
5下载·0评论
2018年6月14日
eclipse配置maprece全教程
2294阅读·0评论·4点赞
2019年10月31日
MapRece编程入门--用eclipse创建MapRece工程
2804阅读·0评论·1点赞
2021年10月22日
Mac下eclipse的Hadoop开发环境配置中以及windows->preferences下看不到Hadoop/MapRece的配置项问题解决
1077阅读·0评论·4点赞
2021年10月23日
eclipse开发MapRece
804阅读·0评论·1点赞
2018年12月22日
Hadoop——MapRece相关eclipse配置及Api调用(图文超详细版)(内含遇到错误的解决方法)
2888阅读·4评论·9点赞
2021年11月10日
Hadoop+eclipse运行MapRece程序
1342阅读·0评论·0点赞
2015年11月24日
hadoop-eclipse-plugin-2.2.0.jar放到eclipse的plugins文件夹后,eclipse中没有map/rece项
5359阅读·0评论·1点赞
2014年6月26日
无需安装虚拟机,Windows本地环境下使用Eclipse通过Hadoop进行MapRece
867阅读·0评论·1点赞
2022年5月6日
Eclipse下编写hadoop的MapRece程序
672阅读·0评论·0点赞
2019年4月28日
在Eclipse中实现MapRece过程
870阅读·0评论·1点赞
2019年6月14日
调用MapRece对文件中各个单词出现次数进行统计
864阅读·0评论·5点赞
2020年12月6日
Eclipse开发maprece程序环境搭建
3007阅读·1评论·4点赞
2019年8月30日
在Eclipse中运行第一个MapRece程序
1736阅读·0评论·0点赞
2011年12月12日
Eclipse本地运行MapRece
650阅读·0评论·0点赞
2018年6月3日
使用eclipse写maprece程序,然后打包程序到集群运行
259阅读·0评论·1点赞
2021年12月1日
使用Hadoop以及Eclipse平台,创建Hadoop项目——编写简单MapRece程序,运行MapRece词频统计程序,查看词频统计程序的结果。
2873阅读·0评论·0点赞
2022年4月29日
eclipse+MapRece
41阅读·0评论·0点赞
2016年8月26日
Hadoop(MapRece)入门 使用Eclipse开发
1.0W阅读·1评论·5点赞
2017年2月9日
在eclipse上搭建maprece开发环境及运行wordcount
9853阅读·0评论·0点赞
2017年2月8日
去首页
看看更多热门内容
㈤ 如何做词频统计
1.先说中文词频统计,网上有不少半成品的软件或工具,如ROST系列ROSTCM6,ROST WordParser等,还有MyZiCiFreq及Excel版本神码的“词频分析工具@Excel大全”,除此之外其他免费的词频统计软件基本就是花瓶。
2.这搏悔些软件都可以在网上下载下来。
3.其中,Rostcm6功能强大,但可惜已经不再更新。excel版本的词频统计功能简洁明了,容易上手。
4.由于目前这些免费的中文词频基瞎正统计软件大都只能统计TXT文本文档,所以如果手头是PDF之类文件的话,需要先PDF转TXT,这时候需要一些工具或技巧,可以到网络经验中搜索具体办法。
㈥ hadoop词频统计失败
服务器连接失败。hadoop词频统计失败是服务器连含伏接失败导致,谈斗携需要重新连接服务器销盯。Hadoop是一个由Apache基金会所开发的分布式系统基础架构。