互联网科技博主

查看更多 a
【AX-LLM:探索业界常用 LLM(Large Language Model) 在已有芯片平台上落地的可行性和相关能力边界】'AX-LLM - Explore LLM model deployment based on AXera's AI chips' GitHub: github.com/AXERA-TECH/ax-llm #开源# #机器学习# #人工智能# ​​​​
【DuckRush:简单快速的后端API,基于 Hono,可以通过关键词在互联网上搜索到相关的内容并转换成适合 LLM 处理的格式】'DuckRush - A simple and fast backend API, based on Hono, that can search for relevant content on the internet using keywords and convert it into a format suitable for L ​​​​...展开全文c
【Swan:使用FPGA的轻量级语言模型执行环境,目标是利用高级综合(HLS)在通用FPGA上高效地运行语言模型】’Swan - This project aims to enable language model inference on FPGAs, supporting AI applications in edge devices and environments with limited resources.' GitHub: ​​​​...展开全文c
'懒人客服 - 基于大模型的智能对话客服工具,支持微信、千牛、哔哩哔哩、抖音企业号、抖音、抖店、微博聊天、小红书专业号运营、小红书、知乎等平台接入,可选择 GPT3.5/GPT4.0/ 懒人百宝箱 (后续会支持更多平台),能处理文本、语音和图片,通过插件访问操作系统和互联网等外部资源,支持基于自有知 ​​​​...展开全文c
【SkipDB & Watermark & Txn:嵌入式、内存中、零拷贝、ACID、MVCC、几乎无锁且提供可序列化快照隔离的数据库引擎】'SkipDB & Watermark & Txn - An embedded, in-memory, zero-copy, ACID, MVCC, almost lock-free and serializable snapshot isolation database engine.' GitHub: ​​​​...展开全文c
【The Nimble File Format:由 Meta 创建的一种新的列式文件格式,旨在取代 Apache Parquet 和 ORC 等文件格式,其设计用于支持宽表和具有数千列的工作负载】'The Nimble File Format - New file format for storage of large columnar datasets.' GitHub: github.com/facebookexternal/nimble #开源# ​​​​
【torchtitan:用于大规模语言模型(LLM)训练的原生PyTorch库】'torchtitan - A native PyTorch Library for large model training' GitHub: github.com/pytorch/torchtitan #开源# #机器学习# #人工智能# ​​​​
【Cloudflare的大模型试炼场,提供包括LLaMa-3-8B在内的多个13B以下模型的在线试用】《Workers AI LLM Playground》 O网页链接 #机器学习# #人工智能# ​​​​
【防止依赖AI导致的认知萎缩】
- 认知萎缩是由于大脑细胞退化或大脑质量减少而导致的认知功能逐渐衰退。依赖AI可能导致某些思维能力的认知萎缩。
- 苏格拉底担心写作会削弱记忆和知识,现代人确实失去了大量记忆信息的能力。同样,依赖AI可能削弱思考能力。
- AI可以胜任某些任务,但人类应该保 ​​​​...展开全文c
【Llama 3发布一周近况概览】
- 模型已经被下载超过120万次,开发者在Hugging Face上分享了超过600个衍生模型。
- Llama 3的GitHub仓库已经获得超过17000 Stars。
- Llama 3 70B Instruct在LMSYS Chatbot Arena排行榜上与另一个模型并列英文评测第一。
- 硬件和云提供商开始为用户部署Llama 3 ​​​​...展开全文c
//@爱可可-爱生活:欢迎参与~
#免费##抽奖# 携手@博文视点Broadview 送出3本《多模态大模型:新一代人工智能技术范式 (全彩)》,截至2024.5.1 12:00,*可可粉*转发+评论即可参与。中山大学 HCP 实验室出品,本书以深入浅出的方式介绍多模态大模型的技术方法、开源平台和应用场景,并详细阐述因果推理、世界模型及多智能体与具身智 ​​​​...展开全文c
今日推介(第1387期):Transformer语言模型中的隐含计算、用门控稀疏自编码器改进字典学习、神经原语言重建、参与性代表性和个性化的人工反馈揭示大型语言模型的主观和多元文化对齐、通用对抗性触发词并不通用 公·众·号:爱可可爱生活 O网页链接 #机器学习##人工智能##论文# ​​​​
[CV] A Survey on Visual Mamba
O网页链接
全面综述Visual Mamba的发展,包括基本概念、用于视觉任务的适配设计、与其他模块的集成,以及在不同视觉任务中的应用,揭示这一新兴架构在计算机视觉领域的巨大潜力。 ​​​​
[CL] Towards Systematic Evaluation of Logical Reasoning Ability of Large Language Models
O网页链接
LogicBench通过设计包含25种推理模式的问答数据集,系统地评估了大型语言模型在命题逻辑、一阶逻辑和非单调逻辑方面的逻辑推理能力,发现现有模型在处理复杂推理和否定时存在明显 ​​​​...展开全文c

正在加载中,请稍候...