印尼语文本抄袭及同义词识别算法
应用背景这是一个程序来检测在印尼语词文本抄袭,尤其是PDF文件。在这个项目中,我使用Java作为编程语言,采用风选法来检测类似的词语,并使用滚动哈希算法计算哈希值。对于同义词,我使
本专区汇聚了各类基于 文本分析 开发的源码资源,共计 121 篇资源供开发者免费下载学习。
应用背景这是一个程序来检测在印尼语词文本抄袭,尤其是PDF文件。在这个项目中,我使用Java作为编程语言,采用风选法来检测类似的词语,并使用滚动哈希算法计算哈希值。对于同义词,我使
C#实现可视化分词
这是一个非常简单的程序,来检查,如果一个词不是是回文数。(回文数是向前和向后,可以说一个字,它拼写相同,像"从不奇数或偶数"— — 把它倒着写,你得到"neve ro ddo 瑞
词频统计,C#完成的!各位参考一下!多提宝贵意见!-Frequency statistics, the complete C#! You take a look! More val
输入一段字符和数字混杂的字符串,本程序能将其中连续的数字取出,并分别作为一个数组输出。(经调试过)-importation of a number of characters an
是一个符号匹配的源程序-match is a symbol of the source
输入一行字符,分别统计出其中英文字母(包括大小写)、空格、数字和其他字符的个数。-fdgfgfdgdfgfgfgfgfgdf
单词词频统计程序,结果使文章中的单词按字典顺序排列,且计算出每个单词出现的频率(即次数)-Word Frequency Statistics of procedures, resu
要求用户输入一字符串,程序检查字符串中的“a”的个数,报告给用户”你输入的字符串中有?个a-require users to input a string, the string
是一款用vc++编写的计算levshtein距离的程序.也就是可以做time alignment,计算两个文档之间最小的距离(插入,删除,替换的最小次数)-is a prepara
给定一篇英文文本,要求提取其中所有的单词并计算其一元词频(某个单词出现的次数)和二元词频(两个连续单词出现的次数) 举例:I have an apple . And you hav
C++ 程序,此程序完成任意一个英文文本文件中英文单词的统计工作-C++ program, this process is complete the English version