基于 LLM 的知识图谱另类实践

2023-09-05
阅读 8 分钟
719
本文整理自社区用户陈卓见在「夜谈 LLM」主题分享上的演讲,主要包括以下内容:利用大模型构建知识图谱利用大模型操作结构化数据利用大模型使用工具利用大模型构建知识图谱上图是之前,我基于大语言模型构建知识图谱的成品图,主要是将金融相关的股票、人物、涨跌幅之类的基金信息抽取出来。之前,我们要实现这种信息抽...

关于 LLM 和图数据库、知识图谱的那些事

2023-08-16
阅读 14 分钟
1.3k
本文整理自 NebulaGraph 布道师 wey 在「夜谈 LLM」主题分享上的演讲,主要包括以下内容:背景LLMRAGGraph知识抽取Text2CypherGraph RAG未来规划技术背景LLM 是什么这里简单、快速地介绍下大语言模型:从 GPT-2 开始,到后来流行的 GPT-3,人们逐渐意识到语言模型达到一定规模,借助部分技术手段之后,程序好像可以变得...

图技术在 LLM 下的应用:知识图谱驱动的大语言模型 Llama Index

2023-07-25
阅读 7 分钟
474
LLM 如火如荼地发展了大半年,各类大模型和相关框架也逐步成型,可被大家应用到业务实际中。在这个过程中,我们可能会遇到一类问题是:现有的哪些数据,如何更好地与 LLM 对接上。像是大家都在用的知识图谱,现在的图谱该如何借助大模型,发挥更大的价值呢?

复杂场景数据处理的 OLTP 与 OLAP 融合实践

2022-10-24
阅读 3 分钟
712
Dag Controller 是 NebulaGraph 企业版的系统,经过反复测试无误后进行了发布,它主要解决的是 OLTP 和 OLAP 的融合问题,以及复杂场景下的图计算问题。也欢迎大家来详细了解下:[链接]。
封面图

开源图编辑库 NebulaGraph VEditor 的设计思路分享

2022-08-15
阅读 3 分钟
1.1k
NebulaGraph VEditor 底层基于 SVG 绘图,它通过合理抽象代码结构以易于二次开发和自定义绘制,极适用于审批流,工作流,血缘关系,ETL 处理,图查询等图(Graph)和网络(Network)型拓扑信息的所见即所得编辑和预览场景。在 NebulaGraph 项目中,VEditor 轻松支持了图查询,图编辑,图建模,图结构,图路径展示等可视...
封面图

OPPO 自研大规模知识图谱及其在数智工程中的应用

2022-07-26
阅读 9 分钟
1.8k
导读:OPPO 知识图谱是 OPPO 数智工程系统小布助手团队主导、多团队协作建设的自研大规模通用知识图谱,目前已达到数亿实体和数十亿三元组的规模,主要落地在小布助手知识问答、电商搜索等场景。
封面图

一文了解 NebulaGraph 上的 Spark 项目

2022-07-18
阅读 15 分钟
1.3k
最近我试着搭建了方便大家一键试玩的 Nebula Graph 中的 Spark 相关的项目,今天就把它们整理成文分享给大家。而且,我趟出来了 PySpark 下的 Nebula Spark Connector 的使用方式,后边也会一并贡献到文档里。
封面图

智联招聘基于 Nebula Graph 的推荐实践分享

2022-06-27
阅读 8 分钟
941
在讲具体的应用场景之前,我们先看下智联招聘搜索和推荐页面的截图。这是一个简单的智联搜索页面,登录到智联招聘 App 的用户都能看到,但是这个页面背后涉及到的推荐、召回逻辑以及排序概念,是本文的重点。
封面图

基于 Nebula Graph 构建百亿关系知识图谱实践

2022-06-27
阅读 6 分钟
1.3k
微澜是一款用于查询技术、行业、企业、科研机构、学科及其关系的知识图谱应用,其中包含着百亿级的关系和数十亿级的实体,为了使这套业务能够完美运行起来,经过调研,我们使用 Nebula Graph 作为承载我们知识图谱业务的主要数据库,随着 Nebula Graph 的产品迭代,我们最终选择使用 v2.5.1 版本的 Nebula Graph 作为最...
封面图

可视化技术在 Nebula Graph 中的应用

2022-06-14
阅读 5 分钟
1.2k
本文首发于 Nebula Graph Community 公众号本文整理自 #可视化 on Live 🔗 主题直播,在本期直播中 3 位可视化嘉宾讲述了他们眼中的可视化,以及他们在可视化项目实践中踩过的那些“坑”。卢晓龙:可视化图探索工具 Nebula Explorer 产品负责人,可视化技术专家;苗壮:可视化图探索工具 Nebula Explorer 核心开发,可视化...
封面图

如何实现十亿级离线 CSV 导入 Nebula Graph

2022-06-14
阅读 13 分钟
1.1k
本次实践是基于业务需求及后续扩展,通过技术选型确定了 Nebula Graph 图数据库,首先需要验证 Nebula Graph 数据库在实际业务场景下批量导入性能并验证。通过 Spark On Yarn 分布式任务执行导入工作,CSV 文件放在 HDFS 上,分享下个人 Nebula Spark Connector 最佳实践。。

隐藏在 Nebula Graph 背后的星辰大海

2022-06-07
阅读 2 分钟
1.3k
graph-ocean 是一款基于 nebula-java 客户端的 ORM(Object Relational Mapping)框架,熟悉 ORM 的小伙伴应该都知道 ORM 是创建可在编程语言里使用的“虚拟对象数据库”,让开发人员更高效地开发业务。
封面图

GraphX 图计算实践之模式匹配抽取特定子图

2022-06-07
阅读 4 分钟
1.5k
Nebula Graph 本身提供了高性能的 OLTP 查询可以较好地实现各种实时的查询场景,同时它也提供了基于 Spark GraphX 的 nebula-algorithm 库以便支持实时的图算法,这里给 Nebula 点个赞,很不错!
封面图

中科大脑知识图谱平台建设及业务实践

2022-05-30
阅读 4 分钟
1.8k
“为了支持城市复杂场景下各类需求,中科大脑知识图谱团队设计开发了一套包含本体可视化设计、数据映射、数据抽取、数据写入、图数据探索的一体化平台,而本文则详细介绍了他们的业务背景、技术选型、平台建设等内容。”
封面图

如何快速解决集群异常和机器性能波动

2022-05-30
阅读 3 分钟
1.3k
前几天,我们收到某公司 Nebula 数据库维护人员小张同学的反馈:发现集群 A 性能波动,同样的语句有时查询快,但是有时慢,帮忙看看是机器还是服务本身的问题呢?
封面图

数仓血缘关系数据的存储与读写

2022-05-26
阅读 10 分钟
1.1k
本文首发于 Nebula Graph Community 公众号一、选择 Nebula 的原因性能优越查询速度极快架构分离,易扩展(目前的机器配置低,后续可能扩展)高可用(由于是分布式,所以从使用到现在没有出现过宕机情况)上手容易介绍全(熟悉架构和性能)部署快(经过手册的洗礼,快速部署简单的集群)使用简便(遇到需要的数据,查询...
封面图

Nebula Graph|信息图谱在携程酒店的应用

2022-05-12
阅读 10 分钟
1.1k
对于用户的每一次查询,都能根据其意图做到相应的场景和产品的匹配”,是携程酒店技术团队的目标,但实现这个目标他们遇到了三大问题…本文着重讲述他们是如何构建场景与信息关系,用 Nebula 处理关联关系,从而快速返回场景化定制推荐信息给酒店用户的实践过程。
封面图

一文带你了解 「图数据库」Nebula 的存储设计和思考

2022-05-06
阅读 9 分钟
1.6k
在上次的 nebula-storage on nLive 直播中,来自 Nebula 存储团队的负责人王玉珏(四王)同大家分享了 nebula storage 这块的设计思考,也解答了一些来自社区小伙伴的提问。本文整理自该场直播,按照问题涉及的分类进行顺序调整,并非完全按照直播的时间先后排序。
封面图

BIGO 的数据管理与应用实践

2022-04-25
阅读 7 分钟
1.3k
本文整理自 BIGO 在 nMeetp 上的主题分享,主要介绍 BIGO 过去一年在数据管理建设方面的理解和探索。而 BIGO 数据管理的核心重点在于元数据平台的建设,用以支撑上层数据管理和建设应用,包括数据地图、数据建模、数据治理和权限管理等等。本文主要围绕以下五个方向展开:
封面图

图数据库|如何从零到一构建一个企业股权图谱系统?

2022-04-24
阅读 15 分钟
1.3k
我们知道无论是监管部门、企业还是个人,都有需求去针对一个企业、法人做一些背景调查,这些调查可以是法律诉讼、公开持股、企业任职等等多种多样的信息。这些背景信息可以辅助我们做商业上的重要决策,规避风险:比如根据公司的股权关系,了解是否存在利益冲突比如是否选择与一家公司进行商业往来。
封面图

图数据库|GitHub 自动合并 pr 的机器人——auto-merge-bot

2022-04-19
阅读 3 分钟
1.4k
作为一款开源的分布式图数据库产品,Nebula 所有的研发流程都在 GitHub 上运作。基于 GitHub 生态 Nebula 技术团队有一套 pr 的自动化流程:每次 pr 提上来的时候, pull request bot 跑一遍测试,看看这个 pr merge 到主分支以后是否可以保证当前的一些功能还可以继续正常运行。
封面图

图数据库|正反向边的最终一致性——TOSS 介绍

2022-04-18
阅读 2 分钟
1.2k
众所周知,边分为无向边跟有向边两种。所以当按有向边去探索时,就可以按正向边 / 反向边做遍历,Nebula Graph 也支持这种语义。比如:
封面图

基于 Nebula Graph 的 BetweennessCentrality 算法

2022-04-13
阅读 6 分钟
1.3k
​在图论中,介数(Betweenness)反应节点在整个网络中的作用和影响力。而本文主要介绍如何基于 Nebula Graph 图数据库实现 Betweenness Centrality 介数中心性的计算。   
封面图

开源分布式图数据库的思考和实践

2022-04-12
阅读 9 分钟
3.1k
本文首发于 Nebula Graph Community 公众号本文整理自 DTCC 主题演讲【开源分布式图数据库的思考和实践】目录目录图数据库市场的现状图数据库的优势以 Nebula Graph 为例开源社区图数据库市场的现状开篇之前,先回顾下图数据库市场变化,2018 年前市场大概是 $ 650,000,000,根据目前市场的研究报告,图数据库市...
封面图

Nebula Graph 在众安保险的图实践

2022-03-30
阅读 5 分钟
1.6k
互联网金融的借贷同传统信贷业务有所区别,相较于传统信贷业务,互联网金融具有响应快、数据规模大、风险高等特点。众安保险主要业务是做信用保证保险,为了服务业务,大数据团队搭建了风控系统用于处理互联网借贷的决策问题。本文主要讲述 Nebula Graph 是如何通过众安保险的选型,以及 Nebula Graph 又是如何落地到具...
封面图

一首古诗带来的图数据库大冒险

2022-03-25
阅读 3 分钟
1.5k
因为图数据库的增长趋势一直位列前茅,每年都有媒体预测今年是“图年”。作为曾经的图数据库从业者,Nebula Hackthon 2021 的参赛队伍临江仙的队长王二铁(王建奎),一直在思考,为什么长期火爆的图数据库市场,一直没有真正引爆。在 2018 年图数据库输给了区块链,2019 年又遇到了 5G,随后疫情开始了。在王二铁看来图数...
封面图

在 Nebula K8s 集群中使用 nebula-spark-connector 和 nebula-algorithm

2022-03-10
阅读 8 分钟
1.4k
解决 K8s 部署 Nebula Graph 集群后连接不上集群问题最方便的方法是将 nebula-algorithm / nebula-spark 运行在与 nebula-operator 相同的网络命名空间里,将 show hosts meta 的 MetaD 域名:端口 格式的地址填进配置里就可以了。

图计算 on nLive:Nebula 的图计算实践

2022-02-22
阅读 11 分钟
2k
在 #图计算 on nLive# 直播活动中,来自 Nebula 研发团队的 nebula-plato 维护者郝彤和 nebula-algorithm 维护者 Nicole 分别同大家分享了他她眼中的图计算。

Geospatial Data 在 Nebula Graph 中的实践

2022-02-19
阅读 4 分钟
1.6k
地理空间数据(Geospatial Data)是包含简单地理空间要素信息的数据,比如点(point)、线(linestring)、多边形(polygon),或是其他更复杂的形状。
封面图

腾讯音乐知识图谱搜索实践

2022-02-18
阅读 5 分钟
2.1k
导读:近几年来,图数据在计算机领域得到了广泛的应用。互联网数据量指数级增长,大数据技术、图数据方面的应用增长很快,各家互联网大厂都在图数据分析和应用方面大量投入人力和物力。为了让我们的搜索更加智能化,腾讯音乐也借助了知识图谱。今天和大家分享下腾讯音乐在图谱检索与业务实践方面的探索,主要包括以下几...