DeepSeek DeepSeek是一款基于深度学习的多模态人工智能模型,具备强大的自然语言处理与代码生成能力,通过深度探索技术实现智能搜索、内容创作及跨领域应用,旨在辅助人类突破技术边界并提升效率与创造力。
ChatGPT ChatGPT是由美国OpenAI开发的对话式人工智能模型,基于生成式预训练Transformer(GPT)架构,通过深度学习实现自然语言交互,可生成文本、代码、诗歌等多类型内容,广泛应用于问答、创作及编程等领域
Qwen 通义千问(Qwen)是阿里巴巴推出的一系列大规模预训练语言和多模态模型,以其卓越的性能、高效的推理能力及处理长文本的优势,在全球开源大模型中占据领先地位,并支持多种任务如自然语言理解、文本生成、视觉理解等
心流 心流 iflow 是阿里旗下杭州万相创意科技有限公司推出的免费 AI 搜索助手,基于淘宝星辰大模型,集成智能搜索、长文本分析、知识问答等能力,构建千亿级专业知识图谱,能助力科研、教育、职场等场景提效
秘塔AI搜索 秘塔AI搜索是一款基于大语言模型(如MetaLLM和DeepSeek R1)的无广告智能搜索引擎,支持多模式(简洁/深入/研究)和多模态(全网、学术、视频)搜索,提供精准答案及20+权威信源,整合高质量论文数据库,以高效信息整合和直达结果体验著称
知乎直答 知乎直答大模型是基于自研大模型(如知海图AI、DeepSeek-R1)构建的AI搜索工具,通过整合知乎社区超8亿条问答数据及5000万篇文献,实现精准、可溯源的问答服务,结合多智能体协同与推理技术,强化用户与答主的互动,降低AI幻觉并提升内容可信度
Grok Grok大模型是马斯克旗下xAI推出的开源混合专家架构(MoE)大模型,参数量达3140亿,支持超长上下文处理(25万字符)、多模态推理及快速响应,其多版本在数学、科学、编程等领域表现优异,成为当前全球大模型竞赛中的领先者
Genspark超级智能体 Genspark是一款基于多AI模型整合的超级智能体,通过混合代理系统(MoA)协调80+工具和10+数据集,实现高效任务执行与实时生成定制化搜索摘要,以提升信息检索效率和可靠性
DeepClaude DeepClaude是由Asterisk开发的开源AI工具,结合DeepSeek R1的推理能力与Anthropic Claude的创造力及代码生成能力,提供高性能、零延迟的LLM推理API与聊天界面,支持自托管和端到端安全,完全免费且开源
纳米AI搜索 纳米AI搜索是一款基于多模态输入(文字、语音、图像、视频)和先进AI模型集成的智能搜索引擎,通过自然语言处理与深度学习技术精准理解用户意图,结合个性化推荐、专家协同的慢思考模式及多款大模型(如豆包、文心一言、DeepSeek)的协同调用,实现从信息获取到内容创作的全流程智能化服务
MetaLaw类案检索 Metalaw类案检索是一款基于人工智能技术的法律工具,通过输入争议焦点或关键词,快速定位相关案例并提供AI分析、思维导图、法律条文引用及报告导出等功能,显著提升法律研究效率。其核心优势在于精准匹配类案、智能总结裁判逻辑,并支持多维度筛选与个性化推荐,帮助用户高效获取法律信息并辅助诉讼策略制定。
得理法搜 得理法搜是深圳得理科技有限公司开发的AI驱动法律数据智能引擎,整合1.3亿+裁判文书、300万+法律法规及5亿+法律数据,覆盖知识产权、地产工程等领域。其核心功能包括智能检索、裁判文书阅读、法律文书生成、案例分析及AI法律咨询,通过自然语言处理技术提升检索效率与精准度
法智 法智大模型是基于GPT-4架构的法律垂直领域大模型,通过融合1.2亿裁判文书和280万部法律法规数据,构建了1300亿参数的LegalGPT-13B模型,具备法律检索、咨询、合同审查、案件分析及文书生成等全场景智能服务功能,显著提升法律实务效率与精准度
📚 从零开始的大语言模型原理与实践教程 本项目是一个系统性的 LLM 学习教程,将从 NLP 的基本研究方法出发,根据 LLM 的思路及原理逐层深入,依次为读者剖析 LLM 的架构基础和训练过程。同时,我们会结合目前 LLM 领域最主流的代码框架,演练如何亲手搭建、训练一个 LLM,期以实现授之以鱼,更授之以渔。希望大家能从这本书开始走入 LLM 的浩瀚世界,探索 LLM 的无尽可能。
大语言模型LLMBook 本书更关注为大模型初学者提供整体的技术讲解,为此我们在内容上进行了大范围的更新与重组,力图展现一个系统的大模型技术框架和路线图。本书适用于具有深度学习基础的读者阅读,可以作为一本基础的大模型参考书籍。在准备中文书的过程中,我们广泛阅读了现有的经典论文、相关代码和学术教材,从中提炼出核心概念、算法与模型,并进行了系统性的组织与讲解。我们对于每个章节的内容初稿都进行了多次修正,力求表达的清晰性与准确性。
大规模语言模型:从理论到实践 大语言模型(Large Language Models,LLM)是一种由包含数百亿以上权重的深度神经网络构建的语言模型,使用自监督学习方法通过大量无标记文本进行训练。自2018年以来,包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT, GPT等在内多种模型,并在几乎所有自然语言处理任务中都表现出色。2021年开始大模型呈现爆发式的增长,特别是2022年11月ChatGPT发布后,更是引起了全世界的广泛关注。用户可以使用自然语言与系统交互,从而实现包括问答、分类、摘要、翻译、聊天等从理解到生成的各种任务。大型语言模型展现出了强大的对世界知识掌握和对语言的理解。本书将介绍大语言模型的基础理论包括语言模型、分布式模型训练以及强化学习,并以Deepspeed-Chat框架为例介绍实现大语言模型和类ChatGPT系统的实践。
Olama Ollama 是一个开源的本地部署工具,专为简化大型语言模型(LLM)的运行和管理而设计。它允许用户在本地机器上运行多种预训练模型,如 Llama 3、Mistral、Code Llama、Gemma 等,从而避免将敏感数据上传到云端,提高隐私和安全性 。Ollama 的核心功能包括模型下载、运行、管理和定制,用户可以通过命令行或图形界面与模型进行交互
硅基流动 SiliconCloud是一站式大模型云服务平台,基于自研推理引擎,实现大模型高效推理加速,让用户无需关注模型层面的底层技术细节,无需担心研发阶段与产品大规模推广所带来的高昂算力成本,助力开发者和企业聚焦产品创新。
LLaMA-Factory LlamaFactory是一个统一框架,集成了一系列前沿的高效训练方法。通过内置的 Web 界面 LlamaBoard,用户无需编码即可灵活定制 100 多个 LLM 的微调过程。我们在语言建模和文本生成任务上通过实验验证了该框架的效率和有效性。
Hugging Face Hugging Face 是一个专注于自然语言处理(NLP)和人工智能(AI)的开源机器学习平台,自2016年成立以来,已成为全球机器学习社区合作开发模型、数据集和应用程序的主要集合地。该平台不仅提供丰富的预训练模型和数据集,还提供了一系列工具和库,帮助开发者快速构建、训练和部署 AI 模型
Colab Google Colab 是一个基于云端的交互式Python编程环境,由Google提供,旨在帮助用户快速、便捷地进行数据科学、机器学习和深度学习等任务。它基于Jupyter Notebook开发,用户无需本地安装任何软件即可在浏览器中编写、运行和分享代码
中国裁判文书网 裁判文书网是最大、最重要的司法案例库的官方数据源,自然成为各家数据公司爬取的对象,裁判文书网反爬措施非常多,爬全全部案例需要大量人力物力,第三方数据平台虽然使用方便,但数据可能不够完整,必要时还是要到官网
法律实务知识库 精选最新法官、律师、仲裁员、法务、学者所著3万余篇高质量实务文章/书籍,日更,涵盖民商、投融资、资本市场、刑事、知产、合规、税务、财富管理等领域,来源:最高院、人民司法、上海司法智库等;数十家知名律所;中国法学网、中外法学、清华法学、法商研究等法学核心期刊