课程小组
¥
支付方式
请使用微信扫一扫 扫描二维码支付
请使用支付宝扫一扫 扫描二维码支付
分享主题
资讯标准化清洗系统的设计与实现
分享嘉宾
邹佳敏,武汉优品财富后台资讯组负责人,主要负责资讯的标准化处理,包括,NLP基础工具,算法研究及应用落地等工作
分享背景
互联网资讯的快速爆炸,使越来越多的人将目光投向“舆情监测”领域,比如,发现热点事件或监控公司风险等。
那么,如何构建一个实时,高效的资讯清洗系统,将杂乱无章的互联网资讯,快速而准确的标准化入库,为后续算法模型提供坚实的语料基础,就成为最重要的基础环节,也是本次分享的主要内容。
分享大纲
1,“优品资讯”整体架构简介:
底层RPC框架:TAF/Tars;
资讯整体的架构方案:抓取,清洗和落地应用
2,“资讯标准化清洗”的架构设计和功能简介
架构,设计和功能
3,“资讯标准化清洗”的模块实现
以分词举例,并实例介绍“最大概率分词”和“HMM分词”算法。
分享时间
(北京时间)2019年1月10日,20:00点