程序名称
文本处理小工具
程序指南
本程序主要有两个功能:文本分词,文本分类
文本分词
功能:将句子切词统计词频
使用步骤:
文件输入路径:存放待分词句子的文件,文件必须是.xlsx格式,目前已支持中文路径
表名:即.xlsx文件中的sheet名,默认为Sheet1,可以修改,目前已经支持中文表名
分析列:即待分词句子所在的列
文件输出路径:将处理完毕的文件放置的位置
已处理行数: 程序已经读完的行数。
点击运行即可
退出,程序中断(这个部分还未完成,目前只能通过关闭整个工具完成)
结果:
程序完成后会在你选择的路径生成相应文件
文本分类
功能:通过分类器分析句子所在类别
使用步骤:
文件输入路径:存放待分词句子的文件,文件必须是.xlsx格式
表名:即.xlsx文件中的sheet名,默认为Sheet1,可以修改
分析列:即待分词句子所在的列
分类项目:选择不同的分类器
选择服务器:不同的分类器部署在不同的服务器上,需分清
文件输出路径:将处理完毕的文件放置的位置
默认情况下,打标签失败的数据丢弃,这里可以选择保留全数据,保留没有打上标签的数据
已处理行数: 程序已经读完的行数。
点击运行即可
退出,程序中断(这个部分还未完成,目前只能通过关闭整个工具完成)
结果:
程序完成后会在你选择的路径生成相应文件
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。