查看原文
其他

开源日报 | 揭秘谷歌搜索引擎;Linus首次亮相香港;中国首个语音端到端大模型;可远程操控机器人的系统;思科“放弃”网络业务?

欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。

OpenSource Daily # 2024.8.23

省流概览

Linus Torvalds 首次亮相香港

- 谷歌搜索引擎全面揭秘

- 可远程操控机器人的新系统,软硬件均开源

- 用多模态LLM提取发票上的文字为结构化数据

- 无人能敌的芬兰小子的故事

- 开源的科学研究助手:OpenResearcher

- 瞄准新摇钱树,思科 “放弃” 网络业务?

今日要闻

Linus Torvalds 首次亮相香港

2024 年 8 月 21 日,由云原生计算基金会(CNCF)和 Linux 基金会联合主办的 KubeCon + CloudNativeCon + Open Source Summit + AI_dev China 2024 在香港开幕。

Linus Torvalds 今天出席了大会,并与早期 Linux 内核贡献者 Dirk Hohndel(现任 Verizon 开源项目办公室负责人)进行了现场交谈。

Linus 表示这是他第一次来香港,虽然 Linux 基金会在这里举办过各种会议和活动,但在他自己参与的在亚洲举办的所有活动中,从未去过香港。

BTW,Linus 称自己非常讨厌公开演讲,他喜欢不知道问题的问答环节。


可远程操控机器人的新系统,软硬件均开源

来自加州大学圣地亚哥分校的团队近日发布了一个跨平台的视觉外骨骼系统(ACE),只需 0.5 万美元左右的预算,就可以实现远程精准操作机器人。

使用者需要用大概 30 秒的时间佩戴好相应的设备,然后就可以用普通模式直接观察和操作手臂,或者以镜像模式控制屏幕上显示的机器人,复合误差在毫秒级!团队已开源了 ACE 的软件和硬件,还有长达 30 分钟的硬件组装教程,网页中有更多详细内容:https://ace-teleop.github.io/


谷歌搜索引擎全面揭秘:近百份文档泄露,博主爆肝数周逆向工程

DeepMind 高级研究科学家 Xingyou (Richard) Song 等人最近发表的论文中,解释了谷歌 Vizier 服务背后的算法秘密。

作为一个运行过数百万次的黑盒优化器,Vizier 帮助谷歌内部优化了很多研究和系统;同时,谷歌云和 Vertex 也上线了 Vizier 服务,帮助研究者和开发人员进行超参数调整或黑盒优化。

Song 表示,与 Ax/BoTorch、HEBO、Optuna、HyperOpt、SkOpt 等其他行业基线相比,Vizier 在很多用户场景中都有更稳健的表现,比如高维度、批查询、多目标问题等。

趁着论文发布,谷歌元老 Jeff Dean 也发推赞扬 Vizier 系统。他提到的开源版 Vizier 已经托管在 GitHub 仓库上,有非常详细的文档说明,并且最近仍在持续维护更新。

仓库地址:https://github.com/google/vizierOSS


今日观察

社交观察


用多模态 LLM 提取发票上的文字为结构化数据

最近有个朋友跟我讨论技术问题,他在用个第三方的 OCR 的服务,用来提取发票上的文字为结构化数据。但收费较高,想自己实现一套,试了开源的 PaddleOCR,识别可以,但是无法转成结构化的数据。

我建议他试试多模态的 LLM,比如 Gemini 1.5 Flash,用来做 OCR 效果非常好,可以在 Prompt 里面定制要输出的格式,并且成本极低。

参考提示词:
***
Extract text from the provided image and organize it into a structured JSON format. 
***

如果要自定义 JSON 格式,给一个样例应该就可以了。

- 微博 宝玉xp

无人能敌的芬兰小子的故事

Nils Torvalds,上世纪 70 年代的芬兰贡产档档圆,在茉斯科学习经济;是芬兰和欧洲政坛的风云人物,不久前曾作为瑞典人民党候选人竞选总统。

他的儿子 Linus Torvalds,在 11 岁那年从 Commodore VIC-20 上开启了 BASIC 编程之旅。

仅仅 10 年之后,Torvalds 发布了 Linux 的第一个版本。再 30 年后,世界上全部的大型机,互联网的绝大部分,智能手机中的绝大部分,和工业嵌入式设备的相当比例,都基于这个操作系统运行。

- 微博 有个梨GPT

开源的科学研究助手:OpenResearcher

一款开源的科学研究助手:OpenResearcher
基于 RAG 技术,通过访问 arXiv 数据集,其可以理解用户问题并从科学文献中找到最相关的答案,总结最新研究成果

准确性、丰富性和相关性方面性能出色,媲美 Perplexity

特点:
1、查找并总结论文内容,比较不同论文观点,提供相关研究领域的其他资源
2、支持多种 LLM,提供 Web 界面
github:https://github.com/GAIR-NLP/OpenResearcher

- 微博 AIGCLINK

悟空在菩提祖师里学了什么(程序员版)

很多人不懂悟空在菩提祖师里学了什么,这么说吧……

老师:我教你 HTML 、CSS3、 JavaScript ,各种流行框架,以后做个优秀前端。
你:不学,不学。
老师:我教你 Java , C #,各种数据库和底层协议,以后做个后端大拿。
你:不学,不学。
老师:我教你 Python , C ++,神经网路,机器学习,数据分析和统计,以后做个 AI 专家。
你:不学,不学。
老师砸了三下键盘,转身而去。
半夜,你跑到老师办公室,老师小声说:我教你黑客技术、木马投放,病毒设计、解密秘诀,外带赠送各大银行的安全漏洞,保你一毕业就能黑进中央银行。
你:对对对,我就想学这个。老师,我以后发大财怎么谢你?
老师:说什么谢不谢的,你以后出了事,别把老师供出来就行。

- 微博 黄鱼Veda

媒体观察

精准学将公布中国首个语音端到端大模型

教育科技公司精准学宣布,公司已在 AI 语音交互技术上取得领先性的突破,成功训练了中国首个语音端到端大模型 “心流知镜 - s (V02)”,可直接实现语音输入 - 语音输出的交互,使其更适配辅学场景,使大模型达到 “真人老师” 级别的自然对话交流体验。

- 数智前线

电商之外,阿里巴巴将目光对准了它?

阿里巴巴管理层表示,对大部分数字化的企业而言,对 AI 的投入是必须的,目前也没有看到市场对 AI 的需求有下降的迹象。接下来几个季度,阿里巴巴对 AI 的投入仍然会维持目前水平。

- 投资时报

AI 智能体箭在弦上,字节跳动的 “扣子” 能否抢先一步?

从形势看,科技巨头主要是想通过 AI 智能体及开发平台来打造自身的 AI 生态系统,让这一系统变得更为多元化、潜力更大。至于其他初创企业和聚焦细分领域的企业,则主要是聚焦让 AI 智能体在垂直类场景落地。

- 科技说说

对话猎豹移动傅盛:大模型不是通往 AGI 的唯一路径

傅盛表示,自己在 AI 1.0 时代便看到了机器人将从传统的工业场景走到服务业场景,乃至千家万户的机会,因此于七年前投资创办了猎户星空。

而在进阶程度更高的 AI 2.0 时代,他用 “人类科技史上的奇迹年” 来形容人工智能的这波崛起,认为可与牛顿的 “万有引力” 或是爱因斯坦 “相对论” 的出现相提并论。在他看来,大语言模型带来的端到端创新范式的影响,对全行业、全社会都会产生巨大改变。

- 界面新闻

瞄准新摇钱树,思科 “放弃” 网络业务?

除了今年之内两次宣布裁员之外,思科最新的 “重组举措” 还包括将其原本独立的网络部门(Networking)与安全(Security)和协作(Collaboration)部门进行整合,以期打造更加统一和精简的产品与服务。对于依靠网络设备起家并实现安身立命的思科来说,这无疑是一个非常重要的转变。

- C114通信网


今日推荐

开源项目
remix-run/remix

https://github.com/remix-run/remix

Remix 是一个新的全栈式 JavaScript 框架,它摆脱了静态网站的生成,并且在其他方面做了一些与我们常用的其他框架不同的事情。它依靠 React 来渲染用户界面,如果你熟悉 Next.js,你肯定能发现很多相似之处。但它也有自己的特点,比如嵌套路由、数据获取和数据保存的处理以及错误处理等。



开源之声

用户观点

微软 “砍刀部” 出手 —— 将近 40 岁的「Windows 控制面板」被淘汰

  • 观点 1:改的好,要多改,大改,linux 就有更好条件发展了

    • 观点 2:利好 linux mac

  • 观点 3:感觉挺好用的啊

  • 观点 4:说实话,设置的功能就是答辩,虽然好看了,但是真的很难用。

  • 观点 5:《几乎用不到控制面板了》

  • 观点 6:如果真能把控制面板所有的功能都迁移过来,我倒是没什么意见

  • 观点 7:设置不就是另一个控制面板?改头换面有什么意义?kpi

  • 观点 8:控制面板更直观,使用更简单。哪个设置应用,用着别扭,功能藏得很深。

  • 观点 9:坐等未来某个时刻缅怀吧 微软砍掉的放弃的都是好东西

    • 观点 10:我也觉得,本来 windows 就已经形成这种习惯,又没有特别的坏处,不知道为什么要放弃,包括一些已经固化的习惯,除非改进的确实特别好,否则,不知道改动意义是什么

  • 观点 11:我就喜欢控制面板,WINDOWS 内又不是所有系统和底层相关设置都是在一个统一的系统 “设置” 里面完成的

小米将对外公开超 1000 万行开源代码

  • 观点 1:ESP32 能用吗?

    • 观点 2:应该可以,eps32 在智能家居方面还是优先的

  • 观点 3:一千万行,是加上各种库一共吗

  • 观点 4:树莓派可以用吗

  • 观点 5:支持 js 语言就行了

  • 观点 6:这种为了工作而产生代码,漏洞肯定不少。等开源后找漏电,米家可卖了不少设备,黑产狂欢。大概率不会全部开源。



程序员梗图

END


References

https://www.oschina.net/news/308465/linus-kubecon-2024-hk

https://weibo.com/5703921756/OtB9A596U
https://weibo.com/6105753431/Otzms5QrX
https://weibo.com/1727858283/OtAxwuihu
https://weibo.com/1655747731/OtuluBkZq
https://weibo.com/3894431038/OtiZmBBlB
https://weibo.com/2177245391/OthFunlQR

https://www.c114.com.cn/news/22/c23586.html

https://k.sina.com.cn/article_5182171545_134e1a99902001v5oc.html

https://mp.weixin.qq.com/s?__biz=MzI4MzAzNzQ2Mg==&mid=2652045846&idx=1&sn=332081d5162f8035aa760cc6d22eab03&scene=0

https://finance.sina.com.cn/stock/relnews/us/2024-08-23/doc-inckrpnm8035249.shtml

https://www.toutiao.com/article/7406177475203547660/

https://github.com/remix-run/remix

https://mp.weixin.qq.com/s/RUazduuGtFhjW7IrGCUuDA

https://mp.weixin.qq.com/s/N0Umv94uR7HOYjUin3iIlg


最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享

继续滑动看下一个
OSC开源社区
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存