数据清洗 资源专区

本专区汇聚了各类基于 数据清洗 开发的源码资源,共计 63 篇资源供开发者免费下载学习。

共找到 63 个资源
其他 1 积分

英语停用词检测类

A English Stop word class. It helps to check whether your word is stopword or not.

英语停用词 NLP 文本预处理
0 0 查看详情
其他 1 积分

数据重复性检查存储过程

一个用来检查数据重复性的存储过程-one used to check the repeatability of data storage process

数据重复性 存储过程 数据质量
0 0 查看详情
其他 1 积分

商品相似度计算与聚合系统

电子商务商品数据进行相似度计算聚合,通过一个或多个字段信息进行指纹计算后,经过相似度算法进行运算,把相似度高的商品数据进行聚合归一化

商品相似度 数据聚合 指纹计算
0 0 查看详情
其他 1 积分

电商商品相似度聚合算法

电子商务商品数据进行相似度计算聚合,通过一个或多个字段信息进行指纹计算后,经过相似度算法进行运算,把相似度高的商品数据进行聚合归一化

电商 商品聚合 相似度计算
0 0 查看详情
其他 1 积分

清角Unicode

This class will help you clear horn unicode. Simple to use. Just call: String clearedHornU

Unicode清理 字符串处理 Java工具
0 0 查看详情
其他 1 积分

字符串英数符号排序算法

给定字符串,按照英文字母、数字、符号顺序排序算法-given string, according to the English alphabet, numbers, symbols

字符串排序 算法 字符处理
0 0 查看详情
其他 1 积分

SQL Server非字母数字汉字字符替换函数

在数据库下建立函数,用来替换文本字段中非字母数字汉字的字符串,可以参照并修改成自己需要替换的字符,自定义函数中主要用到了sqlserver 中stuff函数及patindex

SQLServer 函数 字符替换
0 0 查看详情
其他 1 积分

字符串处理工具:最长公共子串与空格清理

找出两个字符串的最长公共子串。 给出一个字符串,请删除该字符串的前导空格和尾随空格,中间的空格若多余1个删减到1个。 我是个菜鸟,但软件会是我终生的事业~我有信心学好它,希

字符串处理 最长公共子串 空格清理
0 0 查看详情
其他 1 积分

MailChecker:邮件地址验证工具

MailChecker

邮件验证 地址过滤 数据清洗
0 0 查看详情
其他 1 积分

文章停用词去除工具

给一篇文章,然后根据停用词表,去除该文章的内的次用词,然后存入一个文件中。-To an article, and then form the basis of stop words

停用词 文本处理 自然语言处理
0 0 查看详情
其他 1 积分

显式字符串操作工具集

This a collection of functions, and classes that will aid you in very explicit string mani

字符串操作 文本处理 数据清洗
0 0 查看详情
其他 1 积分

模式识别预处理知识源程序

模式识别的一些预处理知识源程序-pattern recognition pretreatment some knowledge source

模式识别 数据预处理 机器学习
0 0 查看详情