GitHub热门开源项目分享(第三期)

向量数据库大模型数据库

01

es-toolkit(javaScript程序库)

Github地址:https://github.com/toss/es-toolkit

该开源项目短时间内就收获了5.9k的Star,es-toolkit 是一个最先进的高性能 JavaScript 实用程序库,具有较小的包大小和强大的类型注释。

  • ES-Toolkit 通过现代实现提供了各种日常实用功能,例如 debounce 、 delay 、 chunk 、 sum 和 pick 。
  • es-toolkit 在设计时充分考虑了性能,在现代 JavaScript 环境中实现了 2-3× 的性能提升。
  • es-toolkit 支持开箱即用的 tree shaking,与其他库相比,最多可将js代码减少97%。

picture.image

  • ES-Toolkit 包含内置的 TypeScript 支持,具有简单而健壮的类型。它还提供了有用的类型守卫,例如 isNotNil 。
  • ES-Toolkit经过实战测试,测试覆盖率为100%,确保可靠性和稳健性。
  
npm install es-toolkit
  
// import from '@es-toolkit/es-toolkit' in jsr.  
import { debounce, chunk } from 'es-toolkit';  
  
const debouncedLog = debounce(message => {  
 console.log(message);  
}, 300);  
  
// This call will be debounced  
debouncedLog('Hello, world!');  
  
const array = [1, 2, 3, 4, 5, 6];  
const chunkedArray = chunk(array, 2);  
  
console.log(chunkedArray);  
// Output: [[1, 2], [3, 4], [5, 6]]

02

MinerU(PDF内容提取工具)

GitHub地址: https://github.com/opendatalab/MinerU

该开源项目短时间内斩获9.9kStar,可见该项目的热度是非常高的。picture.image

MinerU是一款开源高质量数据提取工具,支持PDF/网页/多格式电子书提取,转换为机器可读格式(例如 markdown、JSON)的工具,可以轻松提取为任何格式。MinerU 诞生于 InternLM 的预训练过程中。专注于解决科学文献中的符号转换问题,希望为大模型时代的技术发展做出贡献。

该项目可以进行本地化部署,相关配置要求如下:

picture.image

如果想立即体验一下,可以访问在线Demo演示地址:https://opendatalab.com/OpenSourceTools/Extractor/PDF

03

Docker-OSX(MacOS 虚拟机)

GitHub地址:https://github.com/sickcodes/Docker-OSX

该开源项目目前的Star已达40.3k,非常的火爆,Docker-OSX的功能使 Docker 中运行 macOS VM!在 Docker 中运行接近原生 OSX-KVM,也就是说可以在Windows和Linux上进行操作虚拟的MacOS,前提要有Docker环境。

安装视频:https://www.youtube.com/watch?v=wLezYl77Ll8

picture.image

好了,今天的文章就到这里,点赞关注支持一下,我会及时更新下一期的内容。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
亿万用户下高可用融合直播的应用实践
直播融合 CDN 调度系统承担了公司内所有直播流量的接入工作,对高并发高带宽场景支持友好,有完善的体系进行容灾降级、质量优化、成本优化。本次演讲将带大家了解直播融合 CDN 调度系统的整体架构及在抖音上的应用。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论