admin
文章 90
每日技术 MiniMax推出自家大模型MiniMax-Text-01,超越deepseek-v3
MiniMax 近期宣布推出其最新的语言模型,标志着该公司首次全面开源其技术。这次发布包括两个重要模型:文本模…
每日技术 agent-service-toolkit: 构建 AI 代理服务的完整工具包
在现代人工智能领域,构建和运行自定义 AI 代理变得越来越重要。agent-service-toolkit,是…
NLP MoneyPrinterV2自动生成短视频
MoneyPrinter 版本 2(MPV2)是一款创新的应用程序,旨在自动生成短视频的生成过程。作为 Mon…
NLP MiniMind: 从零开始训练轻量级语言模型的开源项目
在当今大语言模型(LLM)迅速发展的背景下,MiniMind 项目应运而生,旨在为研究者和开发者提供一个简单易…
Github Fun STORM:斯坦福大学的智能知识探索与整理系统
系统 STORM 是斯坦福大学开发的智能知识探索系统,主要用于自动生成维基百科风格的文章和协作式知识整理。该系…
Github Fun 2025-01-03
Github Fun Pathway: 强大的Python ETL框架,助力数据处理与AI集成
项目地址 在当今数据驱动的世界中,高效的数据处理和分析工具变得越来越重要。Pathway 作为一个新兴的 Py…
Github Fun 2025-01-03
llm 深入理解注意力机制:MHA、MQA与GQA的演进与对比
在大语言模型 (LLM) 快速发展的今天,注意力机制 (Attention Mechanism) 始终是核心技…
llm cursor deepseek 配置使用
cursor 是真的下一代编辑器,比什么 IDE 强太多了。下载地址 。默认使用 openai 的 api, …