We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
大数据杂货铺
文章
专栏
问答
大数据杂货铺
图数据库:工作原理及优势
数据库
NoSQL数据库
关系型数据库
机器学习
图数据库是一种专门的 NoSQL 数据库,旨在存储和查询通过定义的关系连接的数据。图数据库的灵活性允许数据在应用程序的整个生命周期中自然连接。
55
0
0
0
大数据杂货铺
图数据库入门指南
技术
技术
图数据库是专门的单一用途平台,用于创建和操作具有关联性和上下文性质的数据,有丰富的应用场景。
17
0
0
0
大数据杂货铺
图数据库入门指南
技术
技术
图数据库是专门的单一用途平台,用于创建和操作具有关联性和上下文性质的数据,有丰富的应用场景。
253
0
0
0
大数据杂货铺
pgvector:30 倍构建向量嵌入索引
大数据
NoSQL
MySQL
Postgres 在向量搜索领域的重要性。通过利用并行索引构建的强大功能,开发人员现在可以更快速、更高效地构建 HNSW 索引,从而显著减少此类任务传统上所需的时间和资源
102
0
0
0
大数据杂货铺
使用 OpenSearch 的 K-NN 向量搜索来增强搜索功能
云原生
火山方舟
向量数据库
大模型
K-NN 向量搜索为跨不同领域提供高度相关的搜索结果开辟了新的可能性。通过利用 OpenSearch 的强大功能,开发人员可以相对轻松地实现高级搜索功能。
62
0
0
0
大数据杂货铺
使用 MongoDB Vector Search 和 OpenAI 进行反洗钱和预防欺诈
移动开发
小程序
计算
开源镜像
基于向量搜索的 Risk 3.0 解决方案可以在 Risk 1.0 和 Risk 2.0 之上实施,以提高检测准确性并减少误报。
49
0
0
0
大数据杂货铺
改进向量搜索-使用PostgresML和LlamaIndex重新排名
开源
MySQL
NoSQL
机器学习
搜索可能很复杂。使用交叉编码器进行重新排序可以通过比较文本对并有效处理新数据来改进搜索。使用 LlamaIndex 和 PostgresML 实现重新排序可以改进搜索结果,在检索增强生成应用程序中提供更精确的答案。
23
0
0
0
大数据杂货铺
将生成式AI 投入生产
AI
火山方舟
向量数据库
智能应用
LLM 是我们如今最接近真正魔法的东西,尽管它可能很迷人,但选择错误的模型可能会导致大量时间和金钱的浪费,而选择正确的模型则可以决定成败。
25
0
0
0
大数据杂货铺
Yarn管理动态队列
云原生
火山方舟
向量数据库
大模型
动态队列是在应用程序运行时自动创建的。当 YARN 服务重新启动时,它们将被删除。
236
0
0
0
大数据杂货铺
使用Flink进行实时日志聚合:第一部分
开源
技术
深入研究实时应用程序的日志记录并使用Flink进行实时日志聚合
350
0
0
0
大数据杂货铺
在业务案例中平台击败单点解决方案的五个原因
云原生
火山方舟
向量数据库
智能语音交互
现在许多企业的系统中每天仍在使用单点解决方案,但是随着 IT 的不断发展,使用平台解决方案的方法几乎在每个用例中都胜过单点的解决方案。
275
0
0
0
大数据杂货铺
Edge2AI自动驾驶汽车:在小型智能汽车上收集数据并准备数据管道
开源
火山方舟
向量数据库
智能应用
CDF提供边缘抓取数据并将其连接到云,并且在数据管道的每个点都具有可见性的解决方案。目标是展示使用Cloudera技术构建自动驾驶汽车应用程序的过程。
308
0
0
0
大数据杂货铺
Yarn管理放置规则
技术
技术
Yarn放置规则可以定义在指定应将哪个队列用于提交的作业时考虑的逻辑。这些预定义规则使您可以在提交作业时无需指定队列名称即可提交作业。
43
0
0
0
大数据杂货铺
使用FreeIPA为CDH6.3集群部署安全
技术
技术
Cloudera从CM6.3版本开始支持FreeIPA来做整个集群的认证,在本文中描述如何使用FreeIPA来做CDH集群的认证。
66
0
0
0
大数据杂货铺
使用上下文策略极大提高AI SQL 准确性
技术
技术
当通过上下文策略查看 SQL 准确性时,很明显这就是造成差异的原因。比当仅使用模式时,我们的准确率从约 3% 提高到智能使用上下文示例时的约 80%。
89
0
0
0
大数据杂货铺
如何消化每天 150 亿条日志,让大查询保持在 1 秒内
技术
技术
该数据仓库用例与规模有关。用户是中国联通,全球最大的电信服务提供商之一。使用 Apache Doris 在数
121
0
0
0
大数据杂货铺
企业生成式AI:2024 年企业的 10 多个用例和最佳实践
技术
技术
与中型市场公司或初创公司相比,生成式人工智能(GenAI)为企业提供了新的机遇,大多数大型企业(即福布斯全球 2000 强)预计将在未来几年内根据其业务需求构建或优化一个或多个生成式 AI 模型。
77
0
0
0
大数据杂货铺
Edge2AI自动驾驶汽车:构建Edge到AI数据管道
技术
技术
本文展示了从边缘到云中数据湖的数据流。数据采用图像的形式以及与我们的自动驾驶汽车收集的每个图像相关的元数据(例如,IMU信息,转向角,位置)。
22
0
0
0
大数据杂货铺
大规模数据管理的路径
技术
技术
过去几年里,去中心化架构成为管理大数据的新范式。本文中我想阐述如何实现这样的联合设计。首先简短反思您的数据策略,以及您是否应该从集中式或分散式方法开始。然后我们将经历实施数据架构的各个阶段,从设定战略方向到奠定基础再到专业化的能力。
312
0
0
0
大数据杂货铺
将数据迁移到CDP 私有云基础的数据迁移用例
技术
技术
使用 authzmigrator 工具将 Hive 对象和 URL 权限以及 Kafka 权限从 CDH 集群迁移到 CDP 私有云基础 集群。使用 DistCp 工具将 HDFS 数据从安全的 HDP 集群迁移到安全或不安全的CDP集群。
34
0
0
0