首页 AI学术青年与开发者社区
资讯标准化清洗系统的设计与实现 猿桌会 | 第65期
如何构建一个实时,高效的资讯清洗系统,将杂乱无章的互联网资讯,快速而准确的标准化入库,为后续算法模型提供坚实的语料基础
开课时间:2019/01/10 20:00 预计时长:一个小时左右
课程回放
276人报名
观看回放
课程介绍

分享主题

资讯标准化清洗系统的设计与实现

 

分享嘉宾

邹佳敏,武汉优品财富后台资讯组负责人,主要负责资讯的标准化处理,包括,NLP基础工具,算法研究及应用落地等工作

 

分享背景

互联网资讯的快速爆炸,使越来越多的人将目光投向“舆情监测”领域,比如,发现热点事件或监控公司风险等。

那么,如何构建一个实时,高效的资讯清洗系统,将杂乱无章的互联网资讯,快速而准确的标准化入库,为后续算法模型提供坚实的语料基础,就成为最重要的基础环节,也是本次分享的主要内容。

 

分享大纲

1,“优品资讯”整体架构简介:

底层RPC框架:TAF/Tars;

资讯整体的架构方案:抓取,清洗和落地应用

2,“资讯标准化清洗”的架构设计和功能简介

架构,设计和功能

3,“资讯标准化清洗”的模块实现

以分词举例,并实例介绍“最大概率分词”和“HMM分词”算法。

 

分享时间

(北京时间)2019年1月10日,20:00点

课程须知
  • 本次公开课将于01月10日周四晚8点准时开始,请大家提前10分钟进入直播间
  • 公开课后两天内会上传回放视频,错过直播的同学也不要担心
  • 欢迎大家多多向嘉宾提问,问题被采纳者有机会获得神秘礼品

授课教师

武汉优品财富后台资讯组负责人
微信扫码分享课程