您当前的位置:首页 > 供应列表 > 技术详情
一种电子商务字典自动生成方法
编号:S000026300 刷新日期: 有效日期至:2020-11-10 浏览:1725 对接邀请:0
意向价格: 面议
所在区域:中国 - 湖南 技术领域:信息通信 - 计算机及软件
转让类型:技术转让
专利类型:发明专利 技术成熟度:可以量产
供应描述
本发明公开了一种电子商务字典自动生成方法,包括以下步骤:步骤1:数据爬取:从电子商务网站、搜索引擎爬取原始商品数据;步骤2:预处理;步骤3:递进穷举;步骤4:词频统计;步骤5:归并处理;步骤6:冗余过滤;步骤7:正则式过滤;步骤8;步骤9:低频词剔除;步骤10:特征词补偿。主要优点包括:一是生成字典的速度快,采用机器学习、智能过滤、纠偏、补偿等算法自动生成字典、可大大提高生成效率。二是生成字典收录率高,由于采用了递进穷举方法对文本进行分词,因此在分词过程中很少会漏掉词条。三是生成的字典更加精炼,结合纠偏、冗余过滤、正则过滤等处理算法,消除字典中的冗余和错误,最终生成的电子商务字典更加精炼。
分享到:
联系方式
在线QQ: 点击这里
机构地址:No.490, S.Ning'an Str., Yinchuan,Ningxia 查看地图
China-Arab States Technology Transfer Center
相似供应