达观曹植大模型正式对外公测!专注于长文本、多语言、垂直化发展

2023-07-14
阅读 2 分钟
850
大模型时代到来,国内出现“百模大战”的局面。达观数据自23年3月宣布研发大语言模型以来,一直积极探索大语言模型的专业化、特长化和产品化。通过多年的高质量数据积累,不断精进算法创新,结合多年的文本处理工程实践经验,已开发出具有长文本、多语言、垂直化三大特点的专用国产“曹植”大语言模型。7月伊始,达观正式对...
封面图

新浪张俊林:大语言模型的涌现能力——现象与解释

2023-04-28
阅读 6 分钟
1.3k
内容来源:ChatGPT 及大模型专题研讨会 分享嘉宾:新浪新技术研发负责人、中国中文信息学会理事 张俊林分享主题:《大型语言模型的涌现能力:现象与解释》 转载自:[链接]

智能文档处理IDP关键技术与实践

2022-11-02
阅读 11 分钟
1.3k
什么是智能文档处理?针对文本数据处理尤其是纯文本,大家通常会想到使用自然语言处理(Natural language processing,NLP)技术来解决语义理解及分析处理工作。关于自然语言处理技术的研究有很长历史,针对不同层面文本处理和分析有很多技术点,常见技术例如分词与词性标注、命名实体识别、句法结构分析、文本分类、文...

听说你想来做人工智能了

2018-08-01
阅读 5 分钟
4.3k
达观数据招人啦! 面向北京、上海、深圳、成都四个地区 提供人工智能、算法、产品、销售等多类岗位 毕业多年,你的状态还好吗? 是否忧虑被甩在时代的边缘? 是否担心被机器取代? 是否不安现状、跃跃欲试? 来吧, 选择对的行业,与优秀的人一起共事, 与我们一起走在时代的风口上, 从事当下最有前景的人工智能行业 深...

A/B测试的数学原理与深入理解

2018-03-02
阅读 8 分钟
6.9k
A/B测试是基于数据来进行优选的常用方法,但是你真的了解A/B测试背后的统计学原理吗?当A/B测试遇到非简单情况时(如分组不够随机时,或用户量不够大到可以忽略组间差异,或不希望大规模A/B测试长期影响一部分用户的收益),该怎样通过掌握理论知识来更好的指导实践呢?本文尝试通过由浅入深的介绍,希望能够帮助大家对A...

达观数据于敬:个性化推荐系统实践

2016-01-29
阅读 6 分钟
8.8k
在DT(data technology)时代,网上购物、观看视频、聆听音乐、阅读新闻等各个领域无不充斥着各种推荐,个性化推荐已经完全融入人们的日常生活当中。个性化推荐根据用户的历史行为数据进行深层兴趣点挖掘,将用户最感兴趣的物品推荐给用户,从而做到千人千面,不仅满足了用户本质的信息诉求,也最大化了企业的自身利益,所...