MemGPT: Towards LLMs as Operating Systems-大模型长记忆解决方案

这是一篇来自伯克利大学的论文,主要针对大模型受限制的上下文,提供了一定解决方案,这里进行了翻译,方便做应用开发/agent开发等场景研发人员进行原理参考

Abstract

Large language models (LLMs) have revolutionized AI, but are constrained by limited context windows, hindering their utility in tasks like extended conversations and document analysis. To enable using context beyond limited context windows, we propose virtual context management, a technique drawing inspiration from hierarchical memory systems in traditional operating systems which provide the illusion of an extended virtual memory via paging between physical memory and disk. Using this technique, we introduce MemGPT (MemoryGPT), a system that intelligently manages different storage tiers in order to effectively provide extended context within the LLM’s limited context window. We evaluate our OS-inspired design in two domains where the limited context windows of modern LLMs severely handicaps their performance: document analysis, where MemGPT is able to analyze large documents that far exceed the underlying LLM’s context window, and multi-session chat, where MemGPT can create conversational agents that remember, reflect, and evolve dynamically through long-term interactions with their users. We release MemGPT code and data for our experiments at https://research.memgpt.ai.

Large language models (LLMs) have revolutionized AI, but are constrained by limited context windows, hindering their utility in tasks like extended conversations and document analysis.
大型语言模型(LLMs)已经彻底改变了人工智能,但受限于有限的上下文窗口,这阻碍了它们在如扩展对话和文档分析等任务中的实用性。

To enable using context beyond limited context windows, we propose virtual context management, a technique drawing inspiration from hierarchical memory systems in traditional operating systems which provide the illusion of an extended virtual memory via paging between physical memory and disk.
为了能够使用超出有限上下文窗口的上下文,我们提出了虚拟上下文管理,这是一种从传统操作系统中的分层内存系统汲取灵感的技术,这些系统通过物理内存和磁盘之间的分页提供扩展虚拟内存的幻觉。

Using this technique, we introduce MemGPT (MemoryGPT), a system that intelligently manages different storage tiers in order to effectively provide extended context within the LLM’s limited context window.
利用这种技术,我们介绍了MemGPT(MemoryGPT),这是一个智能管理系统,能够智能地管理不同的存储层次,以便在LLM有限的上下文窗口内有效地提供扩展上下文。

We evaluate our OS-inspired design in two domains where the limited context windows of modern LLMs severely handicaps their performance: document analysis, where MemGPT is able to analyze large documents that far exceed the underlying LLM’s context window, and multi-session chat, where MemGPT can create conversational agents that remember, reflect, and evolve dynamically through long-term interactions with their users.
我们在两个领域评估了我们受操作系统启发的设计,其中现代LLMs的有限上下文窗口严重限制了它们的表现:文档分析,其中MemGPT能够分析远远超过底层LLM上下文窗口的大型文档;多会话聊天,其中MemGPT可以创建能够记住、反思并通过与用户的长期交互动态发展的对话代理。

We release MemGPT code and data for our experiments at https://research.memgpt.ai.
我们在 https://research.memgpt.ai 上发布了MemGPT代码和我们实验的数据。

Read more

北京可以做便宜核酸的几十家医院整理

随着奥密克戎新冠毒株也流入国内,每年一度的春节也要来临,出京好多地方也要核酸检测,进京也改成了必须要两次核酸,好像我们好多人都免不了做多次核酸检测,这周正好陪我妈去做了一次核酸,简单整理了一下当前北京可以做便宜核酸的各大公立医院的情况~

核酸的单检与混检

本市第6次动态调整“新型冠状病毒核酸检测”项目价格,将公立医疗机构单样本检测价格降低至35元,5样本和10样本混合检测每样本价格降低至8元。关于进一步规范本市新型冠状病毒核酸检测收费行为的通知

选择混检一般会比较便宜,混检是指5-10个标本混在一个试管里,只用检测这一个试管里的试剂,一旦这个试剂阳性,需要把所有标本人员召回,分开单独检测,判断到底是哪个标本阳性,其他出结果的时间,途径应该跟单检没有不同。从概率上来说,阳性发生率这么低,混检跟单检其实没啥区别

四季青医院核酸流程

时间: 周一到周日上午 08 : 00-11 : 30 下午是13 : 00 – 16 : 00
价格:如果是定点医院,还可以再走医保,单检 35元/每人 混检 8元/每人
预约:预约地点是114挂号、和四季青医院公众号,如果预约显示无号了,大家可以直接去现场排队即可,当时没有预约,去了现场排队的,如果预约的话,可能会更快一些可以排到。
报告结果:一般官方说12小时出报告,实际上可能会更快,一般6个小时可能就会出来,上午做下午出,但是有出行的一定要提前打算,要稳妥考虑,报告会显示在健康宝,如果需要纸质报告出了之后在大厅打印再盖公章即可

Ps:去四季青医院时间是22年1月23号哈,大家留意时间

便宜核酸公立医院列表

实际上能到8元的便宜核酸医院均是提供混检的医院,大家记得也要去了选择混检这个选项,这里是整理到的列表,随着时间更新可能会有变动,大家也可以直接联系来沟通

  • 四季青医院 (首推,114可约,约不上也可直接去现场排队)
  • 肿瘤医院
  • 老年医院
  • 中西医结合医院
  • 门头沟京煤集团总医院医院
  • 通州中西结合医院
  • 北京同仁医院南区(亦庄同仁)
  • 友谊医院
  • 良山医院(房山区)
  • 昌平中医院
  • 平谷岳协
  • 平谷区医院
  • 北京普仁医院
  • 北京同仁医院崇文门东区
  • 北京清华长庚医院(鼻拭子)
  • 北京顺义医院
  • 北京电力医院
  • 北京丰台区博爱医院
  • 北京丰台区右安门医院
  • 通州妇幼
  • 昌平区医院
  • 门头沟中医院
  • 延庆区医院
  • 东直门医院通州分院
  • 昌平沙河医院
  • 八大处整形医院
  • 密云妇幼
  • 密云中医院
  • 北京胸科医院(通州)
  • 海淀妇幼保健院
  • 平谷妇幼保健院
  • 房山第一医院

防疫政策查询

最后祝大家出行愉快,可以在本地宝查询 北京去各地防疫政策查询

分享一首音乐《Honey Take My Hand》

非常喜欢这首音乐的歌词,生活应该是美好又温柔的,宇宙山河浪漫,人间点滴温暖,都值得我前进。

Honey Take My Hand
作曲 : Cody Butler

Hey darlin’
嘿,亲爱的
Can I tell you what’s been on my mind?
我能告诉你我一直在想什么吗?
Sick and tired of the nine-to-five and the city life
厌倦了城市朝九晚五的生活
Hey darlin’
嘿,亲爱的
We could get out of town
我们可以出城了
See the beautiful world around
看看周围美丽的世界
Wanna see it now?
现在想看吗?
Pack our bags and get in that car
收拾行李上那辆车
Leave a little note and we’ll drive real far
留个小纸条,我们会开很远的
Let’s get out, we can leave this city
我们出去吧,我们可以离开这个城市
Let’s drive to the open air
我们开车到露天去吧
Yeah the countryside is so pretty
是的,乡村很漂亮
With the wind blowing in your hair
风吹过你的头发
We can look back some day
我们总有一天会回顾过去的
Baby don’t you understand?
宝贝,难道你不明白吗?
That we only get one life, I wanna make it count
我们只有一次生命,我想让它有意义
Honey come on now and take my hand
亲爱的,过来牵我的手
Hey darlin’
嘿,亲爱的
I love it when it’s me and you
我喜欢你和我在一起的感觉
On the road with a couple of tunes
在路上伴着几首曲子
In a car for two
坐两个人的车
Hey darlin’
嘿,亲爱的
You know we’re gonna have a really good time
我们会玩得很开心的
Read more

基于开源项目免费获得JetBrains全家桶License

JetBrains可通过提供免费的所有产品包许可证来支持你的开源项目,以用于项目的开发。如果你是项目负责人或核心贡献者都可以申请JetBrains全家桶license。

这里需要注意,一个项目必须进行至少3个月的积极开发才能获得支持,您应该是该项目的项目负责人或核心贡献者。

另外项目git托管于github或者gitee均可。

填写申请信息

https://www.jetbrains.com/shop/eform/opensource

如下图,填写项目信息,建议使用github项目,这里我是用了存储在gitee的开源项目进行申请,大家如果国内使用了gitee申请也是没有问题的
jetbrainsimage1.png

申请提交邮件提示

一般需要大约两周时间会进行审核及回复。

2020年05月19日 19:54 (星期二)


Hello an,

Thank you for your Open Source license request.

We will evaluate your project, and we’ll notify you of our decision by email. Please note that it could take 1-2 weeks to have your project reviewed.

If your request is urgent or if you have any additional questions, please contact us at JetBrains Community Support.

Kind regards,

JetBrains Community Support Team
www.jetbrains.com
The Drive to Develop

申请通过邮件提示

点击Take me to my license(s) 链接,进行注册账号或者绑定license即可。我这个大约申请时间耗时近20天。

2020年06月09日 21:31 (星期二)

Dear an,
We’re writing to let you know that we have approved your request for free JetBrains Open Source license(s). You can find the license certificate attached to this message.

Your free subscription(s) will be valid for one year. You will receive an automatic email reminder shortly before the licenses expire. If your project still meets our Support Program's requirements at that time, feel free to apply for a renewal.

Please note that JetBrains OS licenses can be used only for development of your non-commercial open source project. Please do not use them for any commercial purposes. If you’ve received more than one license, please share them only with active contributors to your project.

To proceed with your free order, please click the link below:
Take me to my license(s)

We hope that JetBrains software will be useful for your project! If you feel that our tools have helped you a great deal, we would be grateful if you could mention JetBrains' support on your project's homepage. You could do this by placing our Logo and a link to JetBrains such as https://www.jetbrains.com/?from=ABC (make sure to replace ‘ABC’ with the name of your OS project, no spaces). Thanks in advance!

If you have any questions, please feel free to reach us at opensource@jetbrains.com. We’ll be glad to help.

Kind regards,

JetBrains Community Support Team
https://www.jetbrains.com
The Drive to Develop

下载license

全家桶license来咯,点击链接https://account.jetbrains.com/licenses,即可查看相关license,点击Download会下载license压缩包

jetbrainsimage2.png

激活license

菜单项Help->register,将license信息填到activation code文本框即可,激活成功,有效期一年,期满可再次申请。

jetbrainsimage3.png

一些小物件分享

分享一些常用的小物件,杂七杂八什么都有,如果有什么特别喜欢的,也可以一起交流

阅读工具-Kindle

Kindle已经家喻户晓,我的kindle还是14年海淘从日本亚马逊买的,历经一个月的海运到手,那几年海淘的数码产品很多,主要国外便宜,现在看国内价格也不贵了

Kindle阅读pdf书籍,原生支持较差,但是有开源软件可以使用,Koreader是一个支持pdf重排、笔记、词典,同时它的一个特性是侵入性感知非常低,是可以和原生系统并存一个高性能系统。如有需求强烈推荐。

Kindle支持邮箱推送,可以通过配置授信邮箱以邮件的形式进行推送,因为常RSS阅读,所以做了个站,推送部分订阅的文章,感兴趣可以尝试使用task.congcong.us

Kindle unlimited会员,亚马逊出了会员可以购买,内有部分出版书,但是文学类居多,技术类居少。

阅读工具-微信读书

微信读书出版书巨多,技术类的书籍巨多,而且其是社交模式,可以看别人的想法。听书的话中文书籍读起来还是不错的,尽管重构chonggou读成zhonggou,唯一的缺点是英文没色彩,技术类文章中文穿插着英文的情况很多,但是英文读的太生硬就有点出戏了,总的来说推荐,现在还可以书籍白嫖。。。:satisfied:

时间管理-番茄工作法+待办管理

使用番茄工作法结合待办管理去进行工作的时间管理,拆分任务将事情尽可能变小化,二十五分钟去全力做一件事,然后放松休息,一天至少八个番茄,当然995每天番茄更多了,现在的工作打断的事情太多着实有点烦人,长期下去完全没有提升,很多时候白天开会晚上代码,这就是生活吧。

知识管理-随想随记+知识订阅+思维导图

知识管理是个很有意思的地方,我们从小学到大学,再到工作,读过很多书,但是好多也都还给了老师,如何去更好的掌握知识巩固知识呢?

随想随记,有想法或者有好的文章就记录下来,现在是快餐时代,有时候好东西很多,坏东西也很多,信息多了,时间长了你就很难再找回,而这里提供了文字语音图片几种方式去记录我的想法我的思考。

RSS订阅,信息很多散布在各种地方,好的网站更新如何快速的获取到呢?这里我做了RSS订阅,有些博客自带RSS,我通过平台直接订阅,有些不带RSS,我通过平台转换为RSS订阅。这里其实说一点很多时候我们接触的工作场景很少,通过什么让我们来思考呢?我会订阅一些高质量论坛,看看他们遇到什么问题,怎么思考,怎么帮他们解决

思维导图,则是一种回顾知识的好方式,结合微信读书,或者整理一些老系统逻辑,回头再回顾一目了然。

手机浏览器-Alook

Alook无广告、无新闻聚合,一个字评价清爽,另外它的视频二倍速功能非常完善,长按即可转为二倍速模式,看很多新闻视频的利器。同时他还可以自定义脚本,我这里自定义了一个脚本,插入每篇文章一个链接,快速分享到我的网站,用PC可以通过chrome插件分享,用手机浏览器分享麻烦的事情也不存在了,强烈推荐

娱乐软件-皮皮虾

抖音和快手都有自己的特色,但是他们好像是有点类似政局中的极左和极右,三观太偏颇。虾爬子是个消小众软件,里面大多是农村出来,也很多普通青年,有时候会是好色咸鱼,有时候会羡慕爱情,有时候会是芭芭的介绍经验,但是都是好人,在这里好多生活也是我的曾经,更是现在怀念的。

Chrome扩展

Proxy SwitchyOmega

使用的最多的代理工具,支持http、socks4、socks5等功能点击下载

Adblock Plus

免费的广告拦截器点击下载

Charset

改变当前页面编码,编码库还是比较强大的点击下载

RSS Subscription Extension

RSS订阅使用的,可以快速订阅到自己的rss阅读器点击下载
快速订阅到Montage GTD的操作:

录入说明: 订阅到Montage GTD
录入网址:http://task.congcong.us/feeds?url=%s

右键搜

非常方便快速搜索或者分享相关页面和关键词点击下载

快速分享到Montage GTD的操作:

右键“右键搜标识”选择选项,自定义中进行设置:
页面菜单:https://task.congcong.us/notes?add_content=%s
划词菜单:https://task.congcong.us/notes?add_content=%s
图片菜单:https://task.congcong.us/notes?type=image&add_content=%s
链接菜单:https://task.congcong.us/notes?add_content=%s

划词翻译

阅读英文文档的不二利器点击下载

Smart TOC

想梳理一下当前网页文章的时候可以配合使用点击下载

Tampermonkey

可以特定页面执行点击下载

先写这么多,后续陆续再推荐

自建博客小记

搭一个自己的技术博客,相信好多人都经历过下面这些过程

  • 最初学校里面学编程,自己写一个简单博客
  • 买空间做Wordpress博客
  • SAE、Openshift大火时迁移部署开源博客、社交博客
  • 基于GitHub静态页做静态博客

兜兜转转写博客的初衷一定要记得,就是记录工作,记录生活,记录一些自己的想法,内容不用管幼稚与否,他人评价亦是兼听态度,现在的博客使用Wordpress,无他,插件丰富,基础功能够用而已。部署在VPS虚拟机之上。从2003年到现在看看以前的博文真有意思,好多隐藏了,偶尔自己回想一下有趣。

主题

Life_style 一款简洁的主题,简洁大方即可,不追求花里胡哨了:sweat_smile:

插件

反垃圾评论

Akismet Anti-Spam 由千百万人使用,Akismet可能是保护您的站点免受垃圾评论的世界上最好的方式。 您的站点已完全配置并受到不断的保护。

文章目录

Table of Contents Plus 一个功能强大对用户友好的插件,可自动创建目录。 还可以输出列出所有页面和类别的站点地图。

有目录,看文章更好定位位置,推荐这种自动生成目录插件

编辑器

WP Editor.md Markdown 或许这是一个WordPress中最好,最完美的Markdown编辑器

主要是想找一个可以markdown的简洁编辑器,够用即可,这里还支持sm.ms图床,不错

SEO

多合一SEO包 为你的WordPress 博客服务的最酷的SEO。功能有 XML 站点地图,为自定义文章类型的搜索引擎优化,博客或商业网站的搜索引擎优化、电子商务网站搜索引擎优化,以及更多。自 2007 年以来的近 5000 万下载。

SEO用的,简单配置即可,可以生成sitemap相关文件给搜索引擎使用

爬虫角度看第三方12306抢票服务

爬虫

针对网络上信息的抓取 过滤 排名 利用,
取网页数据->存储数据->内容处理->提供检索
这种提供结果不具有特殊性,不能针对不同背景领域的人提供不同的搜索结果,只能提供信息的查询。

Read more

InnoDB存储引擎

InnoDB 是事务安全的 MySQL 存储引擎。完整支持ACID事务,行锁设计,支持MCC,一致性非锁定读,支持外键,最有效利用内存和CPU。

InnoDB体系架构

InnoDB有多个内存块,组成一个大的内存池,负责如下工作:

维护所有进程/线程需要访问的多个内部数据结构。

缓存磁盘上的数据,方便快速的读取,并且对磁盘文件的数据进行修改之前在这里缓存。

重做日志(redo log)缓冲

….

Read more

MySQL体系结构和存储引擎

MySQL设计为一个可移植的数据库,可以在几乎所有操作系统上运行。

数据库和实例

数据库:物理操作系统文件或其他形式文件类型的集合。
数据库实例:由数据库后台进程/线程以及一个共享内存区组成。数据库实例才是真正用来操作数据库文件的。

两者通常一一对应,但是要知道集群情况下一个数据库可以被多个实例使用。

MySQL简述

MySQL是一个单进程多线程架构的数据库。比如用mysqld_safe启动,可以观察到就一个进程。

MySQL启动会多处位置寻找其配置文件my.cnf,比如 /etc/my.cnf -> /etc/mysql/my.cnf -> /usr/local/mysql/etc/my.cnf -> ~/.my.cnf 顺序寻找等等,如果多个均存在时,会以读取到的最后一个配置文件中的参数为准。Linux下一班存放在/etc/my.cnf下。

datadir指定数据库所在路径。比如可以通过 show variables like 'datadir'来查看

MySQL体系结构

image

Level1:管理服务和工具组件 连接池组件

Level2:管理服务和工具组件 SQL接口组件 & 查询分析器组件 & 优化器组件 & 缓存(Cache)组件

Level3:插件式存储引擎

Level4:物理文件

存储引擎是基于表的而不是数据库

Read more

你了解自己么?

篮球赛,客队罚球,一位少年在嘘客队

但是可能变声期,发出来是粗厚的“yu”的声音,有点刺耳

其实我想他是不自知的

好像人们对自己的声音的感觉都不是特别准

比如说我听自己的录音,感觉和自己的声音不像,有时候反而堵住一只耳朵的时候,才发现原来我的声音就是这样

不过就像这位少年一样,希望会有好友或者服务告诉你,然后你改变,成长都是这样过来的

为了更好的了解我自己,我买了个摄像头,因为我还是不自知。。。