Python开源项目周排行 2024年第8周

发布于:2024-04-28 ⋅ 阅读:(36) ⋅ 点赞:(0)

# 2024年第8周 2024年4月12日
1 llama3 当知无愧AI LLM领域当红炸子鸡!Llama 3 是由 Meta AI 开发的大型语言模型 (LLM),于 2024 年 4 月发布。它基于 Megatron-Turing NLG 模型架构,并在超过 15 万亿个标记的公开可用数据上进行了预训练,包括文本、代码和图像。Llama 3 提供两种模型尺寸:8B 参数和 70B 参数。Llama 3 是一个强大的 LLM,可用于各种 NLP 任务。该模型经过预训练和指令调整,以提高其性能和安全性,并支持多种语言。Llama 3 可用于各种商业和研究应用,包括: 聊天机器人 虚拟助手 机器翻译系统 文本摘要工具 代码生成工具
2 text-generation-webui 一个基于 Web 的图形界面 (GUI),用于与 LLM 进行交互。它允许用户轻松地输入提示、选择模型参数并查看结果。Text-Gen Web UI 支持多种 LLM 模型,包括 Transformers、GPT-Q、AWQ、EXL2、llama.cpp (GGUF) 和 Llama 模型。
3 paperless-ngx 款开源的文档管理系统 (DMS),可用于扫描、索引和存档您的物理文档。它可以将您的纸质文件转换为可搜索的数字档案,方便您轻松地查找和管理您的文件。Paperless-ngx 可用于各种个人和家庭场景,包括: 管理个人文件: 您可以使用 Paperless-ngx 管理您的个人文件,例如账单、收据、银行对账单、税务文件等。 管理家庭文件: 您可以使用 Paperless-ngx 管理您的家庭文件,例如出生证明、结婚证、护照、房屋契约等。 管理工作文件: 您可以使用 Paperless-ngx 管理您的工作文件,例如合同、发票、提案、报告等。
4 MediaCrawler 一款功能强大的爬虫工具,可以用于抓取小红书、抖音、快手、B站和微博等主流社交媒体平台的视频、图片、评论、点赞、转发等信息。原理:利用playwright搭桥,保留登录成功后的上下文浏览器环境,通过执行JS表达式获取一些加密参数 通过使用此方式,免去了复现核心加密JS代码,逆向难度大大降低
5 CrawlerTutorial 爬虫方面的教程,爬虫入门、进阶、高级都有.作者全栈程序员,熟悉Python、Golang、JavaScript,工作中主要用Golang。 曾经主导并参与过百万级爬虫采集系统架构设计与编码
6 bilibili-API-collect 本项目旨在对 B站 WEB、APP、TV 等客户端中,散落在世界各地的野生 API 进行收集整理,研究使用方法并对其进行说明,运用了黑箱法、控制变量法、代码逆向分析、拆包及反编译法、网络抓包法等研究办法
7 TheAlgorithms/Python 项目旨在收集所有用 Python 实现的算法。这些实现旨在用于教育目的,帮助学习者理解算法的工作原理以及如何在 Python 中实现它们。学习算法和数据结构:该项目提供了广泛的算法和数据结构的实现,可供学习者参考和学习。 比较不同算法的性能:该项目中的许多算法都提供了多个实现,允许学习者比较不同实现的性能和优缺点。 在自己的项目中使用算法:该项目中的算法可以免费用于个人和商业项目。
8 llm-action 本项目旨在分享大模型相关技术原理以及实战经验。汇总了作者在大模型实践中训练相关的所有教程。从6B到65B,从全量微调到高效微调(LoRA,QLoRA,P-Tuning v2),再到RLHF(基于人工反馈的强化学习)。


 

分类: Python开源项目周排行标签: 爬虫 API 算法



注:当前文章会不定期进行更新。如果您对本文有更好的建议,有新资料推荐, 可以点击: 欢迎分享优秀网站 


网站公告

今日签到

点亮在社区的每一天
去签到