柴洪峰院士:大模型赋能金融科技思考与展望

2023-08-01
阅读 3 分钟
384
本文整理自7月7日世界人工智能大会“AI生成与垂直大语言模型的无限魅力”论坛上中国工程院院士、复旦大学金融科技研究院院长柴洪峰《大模型赋能金融科技思考与展望》的主题分享,从金融垂直模型构建、金融知识图谱与大模型融合以及金融大模型的监管三个方面进行介绍。

RPA界面元素定位与操控技术详解-达观数据

2023-07-24
阅读 9 分钟
378
什么是 RPA?RPA 是机器人流程自动化 Robotic Process Automation 的简写。在《智能RPA实战》中,我们这样定义:通过特定的、可模拟人类在计算机界面上进行操作的技术,按照规则自动执行相应的流程任务,代替或辅助人类完成相关的计算机操作。一句话总结就是:用软件机器人自动化之前由人完成的任务。

达观曹植大模型正式对外公测!专注于长文本、多语言、垂直化发展

2023-07-14
阅读 2 分钟
361
大模型时代到来,国内出现“百模大战”的局面。达观数据自23年3月宣布研发大语言模型以来,一直积极探索大语言模型的专业化、特长化和产品化。通过多年的高质量数据积累,不断精进算法创新,结合多年的文本处理工程实践经验,已开发出具有长文本、多语言、垂直化三大特点的专用国产“曹植”大语言模型。7月伊始,达观正式对...
封面图

一文详解新一代高效前端构建工具VITE-达观数据

2023-07-13
阅读 3 分钟
259
Vite 是一个快速、简单且高效的前端构建工具,它的出现为前端开发者带来了新的构建体验。在本文中,我们将探讨 Vite 的技术原理、优点和使用方法。

Python源码剖析:深度探索Cpython对象-达观数据

2023-07-13
阅读 5 分钟
625
CPython 是 Python 社区的标准,其他版本的 Python,比如 pypy,都会遵行 CPython 的标准 API 实现。想要更深入的认识 Python,就需要了解 CPython 的源码实现。本文将从 CPython 的对象构造器开始入手,带大家揭开 CPython 源码的面纱,带你进入 C + Python 的世界。文章的最后,你也会对 Python 中最重要的概念:一切...

新浪张俊林:大语言模型的涌现能力——现象与解释

2023-04-28
阅读 6 分钟
921
内容来源:ChatGPT 及大模型专题研讨会 分享嘉宾:新浪新技术研发负责人、中国中文信息学会理事 张俊林分享主题:《大型语言模型的涌现能力:现象与解释》 转载自:[链接]

上海首个大模型产业发展研讨会圆满落幕,众顶尖专家共探大模型产业

2023-04-24
阅读 3 分钟
702
4月21日,由上海市数据科学重点实验室携手达观数据、上海浦东软件园联合举办的“大模型产业发展研讨会”圆满落幕。本次研讨会是继达观数据在北京、成都顺利举办“ChatGPT及大模型专题研讨会”后的又一场科技盛会,当天大会汇聚了大模型产业国际和国内顶尖的工业界与学术界专家学者,分享他们在大模型产业发展方面的最新进展...

ChatGPT及大模型专题研讨会在蓉成功举办共探前沿技术与产业发展

2023-04-24
阅读 3 分钟
587
4月14日,由成都市新经济发展委员会指导,成都市人工智能产业生态联盟主办,达观数据承办,智慧蓉城研究院与趋动科技协办的ChatGPT与大模型技术创新与应用发展专题研讨会在蓉圆满落幕。本次专题研讨会围绕ChatGPT和大规模语言模型的发展应用,聚集众多人工智能产学研用大咖,旨在聚焦全球ChatGPT现象级热点,从技术、应...

报名开启!成都首个ChatGPT和大模型专题研讨会,期待您的参与!

2023-04-12
阅读 1 分钟
700
在当今的数字时代,人工智能技术已成为推动社会发展的重要驱动力。作为人工智能领域的热点之一,ChatGPT和大模型技术应用及其发展前景一直备受瞩目。在ChatGPT和大模型技术的推进中,北京、上海、深圳、成都等城市展现出了对人工智能技术发展的强烈关注和前瞻性布局,为我国人工智能技术的创新和升级做出了重要贡献。3月...

达观助手AI智能写作,全方位智能写作新体验

2023-04-12
阅读 2 分钟
1.2k
达观助手是一款智能辅助写作的wps插件工具,采用人工智能技术开发,拥有多项实用功能,如AI续写、AI润色、智能纠错、智能排版、标题AI助手、OCR等,可以极大地提高写作效率和质量。与其他收费的智能写作工具不同,达观助手完全免费,让您轻松享受高效写作的乐趣!无论您是学生、职场人士还是专业写手,都可以通过达观助...

全国首届大模型创新创意应用大赛开启,等你来赛!

2023-04-12
阅读 1 分钟
502
近期,以ChatGPT和GPT4为代表的大规模语言模型陆续发布,带动了人工智能产业的快速发展。大模型已经成为实现认知智能的重要底座之一,已经成为新一轮信息技术革命的主要推动力量。随着国内外各类大模型的陆续发布,基于大模型的智能化应用程序也正在快速涌现。相信在不久的将来,大模型将成为新的类“操作系统”,各类智能...

达观数据研发“曹植”大语言模型,致力于国产GPT模型

2023-04-12
阅读 2 分钟
780
在通用领域,以ChatGPT为代表的生成式大规模语言模型展现出卓越的知识学习和文字创作能力,受到国内外的广泛关注。垂直领域的GPT大模型同样拥有广阔的应用前景。达观基于多年文本智能技术积累和垂直领域场景业务经验,正在积极探索大语言模型LLM的实践,研发国产版GPT“曹植”系统,作为垂直、专用、自主可控的国产版ChatG...

中科院张家俊:ChatGPT中的提示与指令学习

2023-04-11
阅读 10 分钟
713
内容来源:ChatGPT 及大模型专题研讨会分享嘉宾:中国科学院自动化研究所研究员 张家俊分享主题:《ChatGPT中的提示与指令学习》中国科学院自动化研究所研究员张家俊以ChatGPT中的提示与指令学习为题,从ChatGPT简要技术回顾、迈向通用性的提示学习、从提示学习到指令学习、相关探索与学习等角度和在场听众展开技术分享...

探索大语言模型垂直化训练技术和应用-陈运文

2023-03-20
阅读 14 分钟
1.6k
内容来源:ChatGPT及大模型专题研讨会 分享嘉宾:达观数据董事长兼CEO 陈运文博士分享主题:《探索大语言模型垂直化训练技术和应用》 转载自CSDN稿件本文

复旦邱锡鹏:深度剖析 ChatGPT 类大语言模型的关键技术

2023-03-16
阅读 4 分钟
1k
ChapGPT 自问世以来,便展现出了令世人惊艳的对话能力。仅用两个月时间,ChatGPT 月活跃用户就达一亿,是史上用户增速最快的消费应用。对于学术界、工业界、或是其他相关应用来说都是一个非常大的机会和挑战。

AIGC用于智能写作的技术综述-达观数据

2022-12-29
阅读 13 分钟
6.7k
智能写作指使用自然语言处理技术来自动生成文本内容。这种技术通过分析给定语料库,学习文本的结构和语法,然后利用这些信息来生成新的文本。智能写作可以用来快速生成高质量的文本内容,并且可以用来完成诸如文章写作、报告生成和摘要提取等任务。

全国中文纠错大赛达观冠军方案分享:多模型结合的等长拼写纠错

2022-12-29
阅读 8 分钟
869
中文拼写检查任务是中文自然语言处理中非常具有代表性和挑战性的任务,其本质是找出文本段落中的错别字。这项任务在各种领域,如公文,新闻、财报中都有很好的落地应用价值。而其任务的困难程度也赋予了它非常大的研究空间。达观数据在CCL2022汉语学习者文本纠错评测比赛的赛道一中文拼写检查(Chinese Spelling Check)...

中文语法纠错全国大赛获奖分享:基于多轮机制的中文语法纠错

2022-12-29
阅读 5 分钟
723
中文语法纠错任务旨在对文本中存在的拼写、语法等错误进行自动检测和纠正,是自然语言处理领域一项重要的任务。同时该任务在公文、新闻和教育等领域都有着落地的应用价值。但由于中文具有的文法和句法规则比较复杂,基于深度学习的中文文本纠错在实际落地的场景中仍然具有推理速度慢、纠错准确率低和假阳性高等缺点,因...

文字语义纠错技术探索与实践-张健

2022-12-22
阅读 11 分钟
991
文本语义纠错的使用场景非常广泛,基本上只要涉及到写作就有文本纠错的需求。书籍面市前就有独立的校对的环节来保障出版之后不出现明显的问题。在新闻中我们也时不时看到因为文字审核没到位造成大乌龙的情况,包括上市公司在公开文书上把“临时大会”写成为“临死大会”,政府文件把“报效国家”写成了“报销国家”。有关文本纠...

海量文本中挖掘人物关联关系核心技术介绍-桂洪冠

2022-12-15
阅读 5 分钟
1.3k
在大数据时代,通过对目标人物的轨迹、通信、社交、出行、网络等多模态行为进行挖掘并建立人物画像模型,并依托人物基础特征和高层特征,实例化人物画像,支撑有关部门分析人员全方位了解目标人物的行为、活动、状态、基本属性等信息,同时能够基于人物画像指导人物活动规律分析、人物能力分析、人物动向分析等应用。
封面图

多模态文档LayoutLM版面智能理解技术演进-纪传俊

2022-12-08
阅读 9 分钟
932
办公文档是各行各业最基础也是最重要的信息载体,不管是金融、政务、制造业、零售行业等等,各种类型的文档都是业务流转过程中必不可少的数字资料。以银行信贷为例,一笔信贷业务在贷前贷中到贷后全流程中,需要涉及财报、银行流水、贸易合同、发票、尽职调查报告、审批意见书、会议纪要等等材料,材料的格式和内容均差...
封面图

达观数据联合同济大学发布新冠肺炎知识图谱数据集及智能问答系统

2022-12-07
阅读 15 分钟
665
达观数据与同济大学联合共建的“知识图谱与语义计算联合实验室”,近期发布了围绕新冠肺炎的多跳问答数据集和智能问答系统,该数据集基于COVID-19的七个方面(即百科、防控、物资、诊疗、健康、流行病、英雄)进行数据集梳理并进一步生成1跳(1-hop)、2跳(2-hop)、3跳(3-hop)的问答数据集,智能问答的主题涉及病理、...

RPA界面元素智能自适应定位与操控技术

2022-12-01
阅读 8 分钟
775
什么是RPA?RPA(Robotic Process Automation,机器人流程自动化)是通过特定的、可模拟人类在计算机界面上进行操作的技术,它可以按规则自动执行相应的流程任务,代替或辅助人类完成相关的计算机操作,从而节约人力成本,提高生产效率。
封面图

一文详解BERT模型实现NER命名实体抽取

2022-11-24
阅读 7 分钟
1.1k
在自然语言处理和知识图谱中,实体抽取、NER是一个基本任务,也是产业化应用NLP 和知识图谱的关键技术之一。BERT是一个大规模预训练模型,它通过精心设计的掩码语言模型(Masked Language Model,MLM)来模拟人类对语言的认知,并对数十亿个词所组成的语料进行预训练而形成强大的基础语义,形成了效果卓绝的模型。通过 B...

知识图谱增强下的智能推荐系统与应用-于敬

2022-11-17
阅读 15 分钟
960
随着互联网技术的迅速发展,尤其是移动互联网的兴起,新产生的信息呈现爆炸式的增长。为了更好地解决信息获取中的信息过载(Information Overload)和长尾问题(Long Tail),推荐系统应运而生,目前基本上已经成为了各种产品的标配功能。推荐系统是信息过滤系统的一个分支,它可以自动地挖掘用户和物品之间的联系。具体...

知识图谱构建下的自动问答KBQA系统实战

2022-11-10
阅读 8 分钟
1.3k
问答系统(Qusstion Answering System,QA System)在大家的日常生活中随处可见,2014年微软率先推出了小冰智能聊天机器人,直至现在越来越多如siri移动生活助手和智能音箱等的面市,问答作为一种信息获取方式愈发受到大众和厂商的关注和投入。问答系统能够接受用户以自然语言形式描述的提问,并从大量的异构数据中查到或...
封面图

智能文档处理IDP关键技术与实践

2022-11-02
阅读 11 分钟
967
什么是智能文档处理?针对文本数据处理尤其是纯文本,大家通常会想到使用自然语言处理(Natural language processing,NLP)技术来解决语义理解及分析处理工作。关于自然语言处理技术的研究有很长历史,针对不同层面文本处理和分析有很多技术点,常见技术例如分词与词性标注、命名实体识别、句法结构分析、文本分类、文...

探索人机深度融合的高可用性人工智能应用

2022-10-27
阅读 6 分钟
615
目前,人工智能技术在世界范围内热度极高,但却出现了“雷声大、雨点小”的现象。一方面,随着近年来深度学习技术的不断发展,计算能力的不断提高,更深更复杂网络的普及使用,加上深度学习端到端的特性,看起来好像人工智能就是端到端的标注,不断地做数据清洗,增加标注数据,加深模型参数,就可以实现计算机像人类一样...

OCR技术发展综述与达观数据的实践经验

2022-10-13
阅读 10 分钟
1.2k
光学字符识别OCR技术(Optical Character Recognition)是指从图像中自动提取文字信息的技术。这项技术横跨了人工智能里的两大领域:CV(计算机视觉)和NLP(自然语言处理),综合使用了这两大领域中的很多技术成果。
封面图