神经网络专题

共 8 篇文章，按时间倒序展示。

不要用“模仿大脑”来给AI计算量注水了

近期有研究试图用更符合生物学的复杂模型迭代经典神经元公式，声称能减少训练数据。但历史表明，产业界在80-90年代主动选择了简单算式，因为AI的尽头是规模化（Scaling），简单乘加运算易被GPU加速，复杂模型成本...

2026年06月04日TechFoco

中国研究者发现，LLM 中不到 0.1% 的特定神经元（H-Neurons）可预测幻觉，其根源在于预训练和微调的激励机制鼓励模型“过度顺从”。

2026年02月28日TechFoco

Reddit 用户 sultan_papagani 开发了一个开源工具，允许用户在浏览器中上传并 3D 交互式地探索 GGUF 格式大语言模型的内部结构，如层、神经元和连接关系，该工具完全离线运行。

2026年02月11日TechFoco

本文介绍了一份机器学习工程师的养成指南，提出通过约50小时的刻意练习，分三个阶段学习，掌握从数学基础到动手搭建GPT模型的能力。

2026年01月23日TechFoco

一本通过直观语言和可运行代码，系统介绍现代神经网络构建的入门书籍。内容涵盖自动微分、核心架构及前沿模型，并已发布第二卷强化学习章节。

2025年12月27日TechFoco

本文探讨了深度学习有效性的一个理论视角，即其可能借鉴了物理学中的全息原理，通过张量网络结构将高维信息高效编码于低维表示中，从而实现强大的特征提取与泛化能力。

2025年10月07日TechFoco

亚马逊推出的一个交互式、可视化机器学习教学项目，旨在以有趣易懂的方式教授神经网络、回归、强化学习等核心概念。

2025年02月16日TechFoco

《深度学习数学工程》一书从数学工程视角系统概述了深度学习，涵盖 CNN、RNN、Transformer、GAN 等主流模型，聚焦于其数学描述与基础原理，旨在帮助具有数学背景的专业人员快速把握领域本质。

2023年12月31日TechFoco