weekly/docs/issue-332.md

20 KiB
Raw Blame History

科技爱好者周刊(第 332 期):西蒙·威利森的年终总结,梁文锋的访谈

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系yifeng.ruan@gmail.com

封面图

世界最长的高速公路隧道“天山胜利隧道”本周贯通长达22.13公里汽车要在里面开20分钟。它连接了被天山隔断的南疆和北疆。via

西蒙·威利森的年终总结,梁文锋的访谈

英国程序员西蒙·威利森Simon Willison最近两年非常出名他的个人网站有很多文章,介绍 AI 的最新进展。

本周,他发表了很长一篇的2024年大模型回顾(非官方的中译),非常精彩。

他提到AI 的发展速度快得难以想象。

一年前的2023年底排名第一的 AI 模型是 OpenAI 公司的 GPT-4没有其他模型能超过它。

一年过去了大家猜猜GPT-4 现在排名多少?

答案是第69位上图已经有18家公司的大模型超过了它。其中的一些模型甚至可以在笔记本电脑运行。

短短一年榜首模型就被大量竞争者轻松超过家用硬件就能达到它的运行效果。AI 的进化速度就是这么惊人。

西蒙·威利森特别提到了来自中国的大模型 DeepSeek V3

DeepSeek V3 是2024年12月25日发布的来自杭州的量化基金公司幻方量化。一经发布它就引起了国际范围的轰动。

它在多个参数上,击败了 OpenAI 公司最新的 o1 模型。目前它在大模型排行榜上排名第7要知道前十名里面只有它是开源模型,而且是最少限制的 MIT 许可证,其他都是大公司的专有模型。

而且,它的运行效率很高,训练成本估计只有 Meta 公司的 Llama 3.1 405B 模型的11分之一而后者的效果还不如它。这就是说DeepSeek 找到了高效使用硬件、提高模型效果的方法。

西蒙·威利斯说“DeepSeek V3 的训练成本不足600万美元是一个极好的迹象表明 AI 模型的训练成本可以而且应该会继续下降。”

西方媒体就非常好奇DeepSeek 是怎么做到的?

幻方量化创始人梁文锋,跟其他 AI 模型的研究者不同,没有海外经历,毕业于浙江大学电子工程系人工智能方向。

西方媒体对他充满了好奇,专门将他以前的访谈译成了英文

我觉得,原始的中文访谈( Part 1Part 2)很值得一读,我分享他说的几段话,展示了中国顶级研究者的视野和抱负。

1我们要做的不是生成式 AI而是通用人工智能 AGI。前者只是后者的必经之路AGI 会在我们有生之年实现。

2任何 AI 公司(短期内)都没有碾压对手的技术优势,因为有 OpenAI 指路,又都基于公开论文和代码,大厂和创业公司都会做出自己的大语言模型。

3在颠覆性的技术面前闭源形成的护城河是短暂的。即使 OpenAI 闭源也无法阻止被别人赶超。我们把价值沉淀在团队上我们的同事在这个过程中得到成长积累很多know-how形成可以创新的组织和文化就是我们的护城河。

4我们不会闭源。我们认为先有一个强大的技术生态更重要。

5当前阶段是技术创新的爆发期而不是应用的爆发期。大模型应用门槛会越来越低创业公司在未来20年任何时候下场也都有机会。

6过去很多年很多的中国公司习惯了别人做技术创新拿过来做应用变现自己等着摩尔定律从天而降躺在家里18个月就会出来更好的硬件和软件。我们的出发点就不是趁机赚一笔而是走到技术的前沿去推动整个生态发展。中国也要逐步成为贡献者而不是一直搭便车。

7大部分中国公司习惯 follow而不是创新。中国创新缺的不是资本而是缺乏信心以及不知道怎么组织高密度的人才。我们没有海外回来的人都是本土的。前50名顶尖人才可能不在中国但也许我们能自己打造这样的人。

8我们每个人对于卡和人的调动是不设上限的。如果有想法每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门也可以灵活调用所有人只要对方也有兴趣。

9我们选人的标准一直都是热爱和好奇心所以很多人会有一些奇特的经历很有意思。很多人对做研究的渴望远超对钱的在意。

10我们在做最难的事。对顶级人才吸引最大的肯定是去解决世界上最难的问题。其实顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了使得他们没有机会被识别出来。我们在做最难的事对他们就是有吸引力的。

11中国产业结构的调整会更依赖硬核技术的创新。很多人发现过去赚快钱很可能来自时代运气现在赚不到了就会更愿意俯身去做真正的创新。

12我是八十年代在广东一个五线城市长大的。我的父亲是小学老师九十年代广东赚钱机会很多当时有不少家长觉得读书没用。但现在回去看观念都变了。因为钱不好赚了连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就群体性想法就会改变。我们只是还需要一堆事实和一个过程。

科技动态

1、AirTag 充电盒

苹果公司的 AirTag 可以追踪物品,但如果没电,就无法追踪了。

一位国外程序员就遇到了这个问题。他的1万美元装备的相机包放在车后座被偷了当他打开追踪时才发现里面的 AirTag 忘了换电池,已经无法追踪了。

他痛定思痛,发明了一个 AirTag 充电盒,把两节五号电池跟 AirTag 封装在一起,为后者充电。

据他说这个充电盒可以持续工作10年完全不用担心没电。

只要把这个小盒子跟你要追踪的物品,放在一起,就不用管它了,一直可以追踪。

2、无护照过海关

从2024年9月30日开始新加坡公民通过樟宜机场出入境不再需要护照了。

机场会使用人脸识别和虹膜识别,来代替护照。这样更省时、成本更低。

纸制护照已经过时了,也许不久将来就会消失。

3、世界最大 3D 打印社区

美国得克萨斯州即将完工世界最大的 3D 打印社区共有100幢住宅。

这些房子都是一个巨大的 3D 打印机生成的。

房屋的打印材料是混凝土粉末、水、沙子、添加剂的混合物,喷嘴将混合物像牙膏一样挤出,沿着预先编程的路径层层堆叠,形成墙壁。

建筑公司表示3D 打印房屋更快、更便宜,现场只需要一个操作员,并且最大限度地减少了建筑材料浪费。

单层的三居室或四居室住宅,大约需要三周才能打印好所有墙壁,然后再用传统方式加固地基和安装屋顶。

4、其他

1网友发现Spotify 歌单里面,有些音乐家根本不存在,他们的作品很可能是 AI 生成的Spotify 以此减少付出的版权费。

2百度推出“Ai 搜”,汇集了各种 AI 相关功能。

文章

1、2024年 Linux 发行版推荐(英文)

作者介绍他心目中,各种用途最佳的 Linux 发行版。

2、中美工作感想(中文)

“过去四年五个月,我随着工作从 SF 搬到北京,再搬到上海,后来搬回美国在洛杉矶住了一年半。”本文是国内做工程师和美国做工程师的对比。(@wukan 投稿)

3、开发者应该知道的10个终端命令(英文)

本文简单介绍10个终端命令比如 grep、awk、sed、find 等。

4、Meta 四次面试经历(中文)

“这些年,我一共面试了四次 Facebook/Meta。虽然都未成功但收获颇多。”@DoctorLai 投稿)

5、算法面试心得(中文)

本文是作者对如何应付一般的算法面试的知识总结和心得。(@javayhu 投稿)

6、我们用 React 取代了 Next.js(英文)

作者难以忍受 Next.js 的庞杂和性能,改为直接使用 React不再用基于它的框架了。

7、Windows 的增强剪贴板(英文)

我很少用 Windows现在才知道它的剪贴板有同步功能还能永久保存。

工具

1、Ghostty

一个终端模拟器,使用 GPU 渲染 UI支持 mac 和 Linux。作者是 HashiCorp 公司创始人,参见介绍文章

2、Black Candy

一个自搭建的音乐流媒体服务器,自带手机和 Web 客户端,相当于自己的云音乐平台。

3、curl-impersonate

一个 curl 的改写版,使其发出的 HTTP 请求就像 Chrome/Firefox 发出的。

4、RSS.Beauty

将普通的 RSS/Atom 订阅源转换成美观的阅读界面,代码开源。(@ccbikai 投稿)

5、AI Shadcn 主题生成器

输入关键词,就可以免费生成 Shadcn 主题。(@meetqy 投稿)

6、懒猫书签

开源的 Chrome 插件,一键清理失效链接和空文件夹。(@Alanrk 投稿)

类似插件还有 Bookmark Pro。(@wincatcher 投稿)

7、Nping

Rust 语言开发的 Ping 工具,支持多个地址并发 Ping并附带实时折线图展示。@hanshuaikang 投稿)

8、peepDB

一个命令行工具,连接各种主流的关系型数据库,查看表内容。

9、File Pilot

非官方的 Windows 文件管理器,号称可以取代官方的资源管理器。

10、Doggo

一个易用的 DNS 命令行查询工具。

它的官网首页还提供 DNS 在线查询。

AI 相关

1、DeepSeek Coder

根据提示生成 App基于 DeepSeek V3 模型。(@sing1ee 投稿)

2、GodView

语义化地图用自然语言查询地图比如输入“请展示上海的前10大图书馆”。

3、对话 CEO

与马斯克、张一鸣、任正非对话,效果还可以。(@5A59 投稿)

4、ithy

AI 模型聚合网站,输入关键词,同时返回 Lllma 3.1、o1-mini、Sonnet 3.5、Grok 2、Gemini 1.5 pro 的生成结果。

5、AutoMouser

开源的 Chrome 浏览器插件,将鼠标操作通过 AI 转为 Selenium Python 脚本,需要 OpenAI key。@guoriyue 投稿)

资源

1、search the arXiv

arXiv 论文库的搜素引擎,使用自然语言搜索。

2、《算法第4版》的 C++ 实现

这个仓库包含《算法第4版》教科书介绍的算法的 C++ 语言实现,与原书的 Java 实现相对应,(@landerrosette 投稿)

3、EmojiClick

使用自然语言搜索 Emoji 符号。(@yijianbo 投稿)

4、独立开发者工具

该仓库收集独立开发者出海技术栈和工具。(@yaolifeng0629 投稿)

图片

1、世界最美钞票

2023年国际钞票协会评选当年的“世界最美钞票”。得奖者是东加勒比中央银行发行的2元纸币。

这张钞票色彩缤纷,确实非常漂亮。正面是当地板球明星,以及银行标志、乌龟和鱼。

背面是鱼、珊瑚、海龟、蓝色岛屿地图。

2、行业圣诞树

上周圣诞节,美国媒体贴出了,各行各业搭建自己圣诞树的照片。

披萨店的外卖盒圣诞树。

家装店的玻璃圣诞树。

修路队的交通锥圣诞树。

书店的圣诞树。

电脑店的圣诞树

超市的香蕉圣诞树

文摘

1、亚马逊河为什么没有桥?

南美洲的亚马逊河是世界第二长的河流,仅次于非洲的尼罗河。

但是,这条河没有一座桥,是唯一一条没有任何桥梁的世界主要河流。这是为什么呢?

首先每年的雨季亚马逊河都会泛滥河流的宽度会从旱季的5公里变成50公里就像下图那样很难造桥。

其次亚马逊河沿岸人烟稀少只有很少几个城镇。最大一个城市的人口只有50万不存在前往河对岸的强烈需求。

最后,亚马逊河两岸都是原始森林,并没有现成道路。如果造桥就需要砍伐大量森林,修建引桥和公路,环境代价很大。近年来,环保意识逐渐高涨,反对造桥的呼声也就越来越大。

言论

1、

由于 AI 的出现,英语正在成为最热门的新编程语言。

-- Andrej Karpathy,著名的 AI 科学家

2、

除非手机可以当成电脑使用,否则我不打算再为性能升级手机了,不再为越来越快的 CPU 买单了。

-- Android Authority 专栏作家

3、

保护海底光缆不出事是不可能的,你唯一能做的就是建立大量冗余,在不同位置铺设数十根光缆可能比保护它们更便宜。

-- Hacker News 读者

4、

强大的工程师不在于速度快或产出高,而在于能够完成其他工程师无法完成的任务。弱小的工程师几乎任何任务都完成不了。

如果你和一个弱小的工程师一起工作,你可以帮他,但一定要保护好你的时间,防止他把你的时间都消耗光。

-- 《强大的工程师与弱小的工程师》

5、

人工智能并不是释放我们的想象力,而是外包它们。

-- 英国《卫报》

往年回顾

为什么 PPT 不如备忘录#285

青年失业率与选择创业#235

美国宪法拍卖,一个区块链案例#185

什么行业适合创业?#135

(完)