你好,我是猫哥。这里每周分享优质的 Python、AI 及通用技术内容,大部分为英文。周刊开源在 Github 上,喜欢请给颗小星星支持下~
本期分享了 12 篇文章,12 个开源项目,全文 2200 字。
CIA 用 Python 做黑客攻击以及实用工具,最喜欢的版本是 Python 2.7 和 3.4。文章收集了 CIA 运用 Python 的编程实践,包括遵循谷歌 Python 风格指南、用 pip2tgz 做包下载、本地 pypi、Pycharm + pyenv、在远程服务器执行测试、CLI 脚本模板等。
Python 依赖管理工具很多样化,文章逐一分析了 13 款工具的优缺点。作者的简单建议是:若只依赖 Python 包,则推荐 uv 和 pipx;若需维护多个互斥环境,则推荐 pip + venv + pip-tools + pyenv。
作者特别讨厌 LangChan 和 LlamaIndex,认为它们是过度封装的典型代表。文章举了 LlamaIndex 使用依赖注入的例子,并解释了它对二次开发的不友好,另外对比了 Requests 作者的新作品 SimpleMind,看到了不过度封装的实现应该是怎样的。(附:Octomind 团队的 为什么我们不再用 LangChain 开发 AI 智能体?)
文章详细解释了如何用 Python 实现 DNS 协议的多数功能,创建出一个可信赖的本地 DNS 服务器。
对 Python 社区中多款 Web 开发框架的对比分析,包括 Reflex、Django、Flask、Gradio、Streamlit、Dash 和 FastAPI,它们的优缺点各是什么?
元循环解释器用一门语言自身来编写该语言的解释器。为什么要开发元循环解释器?好处是能高度控制代码执行、高效追踪代码执行过程。这篇长文详细介绍了元循环解释器能做的事以及如何实现。
7、该放弃 Spark 选择 DuckDb 或 Polars 吗?
新兴的 DuckDB 和 Polars 这种轻量级计算引擎越来越流行,是否可取代传统的 Spark 了呢?文章通过性能、执行成本、开发成本和引擎成熟度等维度作了基准测试,发现 Spark 在扩展性和成本方面仍有优势,还不到完全放弃的时候。
作者分享了一个由于 Django 错误设置导致的远程代码执行漏洞案例,Django 的一些默认行为会导致安全问题。作者做了一些努力,但被标记“wonfix”,因此呼吁开发者关注潜在的安全问题,希望引起官方重视做出修复。
作者为了省去查看手机的麻烦,在电子墨水屏上展示儿子的学校时间表。他通过 Playwright + Pillow 获取内容并转为图片,再用 Werkzeug 库创建一个简单的 Web 服务,并用 Arduino 实现自动唤醒和更换图片。
一行不起眼的“foo.bar = foo.bar”实际上创建了一个循环引用,造成内存泄漏。在 monkeypatch 场景下容易出现类似用法,文中分享了用 weakref 来避免循环引用的小技巧。
文章探究了一个有趣的问题:将质数绘制在极坐标系中能看出什么规律?作者用 sympy 库生成质数,用 matplotlib 作可视化,最后出现一个美丽的图案!如何解释它呢?

前1万个质数的坐标图
MCP 协议用在大模型和数据源间建立安全双向的链接,这到底意味着什么?它的出现能解决什么问题?作者详细演示了官方示例的步骤,解释了数据交互的过程,并用真实数据集做测试,可以看出 MCP 还是很有用的。(附:关于使用 MCP 开发的反思 )
1、markitdown: 将各种文件转换为 Markdown 格式
微软最新开源的热门项目,支持将各类文件转换为 Markdown 格式,除了 office 三件套,还支持 pdf、图片、音频、HTML、CSV、JSON、XML、ZIP 文件等。(star 24.3K)(附:一个利用 markitdown 实现的在线网站 office 文件转 Markdown)
2、systemd-pilot:用于管理 systemd 服务的桌面程序
一个用于管理 GNU/Linux 系统上 systemd 服务的桌面应用,支持查看、筛选、启动、停止、重启服务,支持用模板快速部署、简单搜索、全面集成到 GNOME 桌面。
Python 全栈项目,一个功能齐全的电商平台,具有强大的管理员面板和现代的用户界面,支持多图上传、购物车、愿望单、仪表板、PDF 发票、销售跟踪等功能。

用 Python 开发的一站式 AI 影视解说与自动化剪辑工具,利用 LLM 撰写文案、自动化剪辑/配音/生成字幕,助力高效的内容创作。(star 2.6K)
腾讯家的视频大模型,已开源文本生成视频、待支持图像生成视频。(star 6.4K)
6、SeleniumBase:网络自动化、测试以及绕过机器人检测
一站式浏览器自动化框架,支持网页抓取、自动化测试、爬虫、绕过验证码等功能。(star 7.1K)
7、BlackSheep:快速的 Python ASGI Web 框架
一个异步 Python Web 框架,构建基于事件的应用。受到 Flask、ASP.NET Core 的启发。(star 2K)
8、PDFMathTranslate:基于 AI 的 PDF 文档全文双语翻译
Python 开发的 PDF 文档翻译及双语对照工具,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker,保留公式、图表、目录和注释。(star 10K)
9、cookbook:谷歌 Gemini API 的示例和指南
官方发布的一系列关于 Gemini API 的指南和示例。Gemini 模型支持多模态,可在文本、图像、代码和音频之间无缝推理。(star 9K)
10、tkforge:用 Figma 轻松创建 Python GUI
类似于 Tkinter Designer,在 Figma 中通过拖拽方式创建 GUI项目,用这个工具转换为可执行的 Python 代码。
11、MegaParse:利用 LLM 无损解析 PDF、Docx、PPTx
功能强大且灵活的解析器,可轻松处理各种类型的文档,无信息丢失、快速高效。(star 4.6K)
一款基于 Markdown 的笔记应用,具有任务管理功能。界面简洁,多种主题,支持任务、图片、文件和代码片段。

Python 潮流周刊#32:打造个人的新闻聚合阅读器 (2023.12.23)
技术周刊是聪明人在信息过载时代中筛选优质知识的聪明手段。这是一个专为国内 Python 开发者量身打造的资讯平台,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等丰富内容。立即订阅,每周将收到一篇文章推送,每周进步一点点。
欢迎留言,说说你最喜欢本期的哪一则分享?大家反馈得越多,我今后分享的也会越多!
欢迎将本专栏分享给同样爱学习的同学,当有人通过你分享的海报或者链接,购买了专栏,那么你将获得高额的返利。
万字浓缩版,Python 潮流周刊第 1 季的 800 个链接!
你好,我是猫哥。这里每周分享优质的 Python、AI 及通用技术内容,大部分为英文。周刊开源在 Github 上,喜欢请给颗小星星支持下~
本期分享了 12 篇文章,12 个开源项目,全文 2200 字。
CIA 用 Python 做黑客攻击以及实用工具,最喜欢的版本是 Python 2.7 和 3.4。文章收集了 CIA 运用 Python 的编程实践,包括遵循谷歌 Python 风格指南、用 pip2tgz 做包下载、本地 pypi、Pycharm + pyenv、在远程服务器执行测试、CLI 脚本模板等。
Python 依赖管理工具很多样化,文章逐一分析了 13 款工具的优缺点。作者的简单建议是:若只依赖 Python 包,则推荐 uv 和 pipx;若需维护多个互斥环境,则推荐 pip + venv + pip-tools + pyenv。
作者特别讨厌 LangChan 和 LlamaIndex,认为它们是过度封装的典型代表。文章举了 LlamaIndex 使用依赖注入的例子,并解释了它对二次开发的不友好,另外对比了 Requests 作者的新作品 SimpleMind,看到了不过度封装的实现应该是怎样的。(附:Octomind 团队的 为什么我们不再用 LangChain 开发 AI 智能体?)
文章详细解释了如何用 Python 实现 DNS 协议的多数功能,创建出一个可信赖的本地 DNS 服务器。
对 Python 社区中多款 Web 开发框架的对比分析,包括 Reflex、Django、Flask、Gradio、Streamlit、Dash 和 FastAPI,它们的优缺点各是什么?
元循环解释器用一门语言自身来编写该语言的解释器。为什么要开发元循环解释器?好处是能高度控制代码执行、高效追踪代码执行过程。这篇长文详细介绍了元循环解释器能做的事以及如何实现。
7、该放弃 Spark 选择 DuckDb 或 Polars 吗?
新兴的 DuckDB 和 Polars 这种轻量级计算引擎越来越流行,是否可取代传统的 Spark 了呢?文章通过性能、执行成本、开发成本和引擎成熟度等维度作了基准测试,发现 Spark 在扩展性和成本方面仍有优势,还不到完全放弃的时候。
作者分享了一个由于 Django 错误设置导致的远程代码执行漏洞案例,Django 的一些默认行为会导致安全问题。作者做了一些努力,但被标记“wonfix”,因此呼吁开发者关注潜在的安全问题,希望引起官方重视做出修复。
作者为了省去查看手机的麻烦,在电子墨水屏上展示儿子的学校时间表。他通过 Playwright + Pillow 获取内容并转为图片,再用 Werkzeug 库创建一个简单的 Web 服务,并用 Arduino 实现自动唤醒和更换图片。
一行不起眼的“foo.bar = foo.bar”实际上创建了一个循环引用,造成内存泄漏。在 monkeypatch 场景下容易出现类似用法,文中分享了用 weakref 来避免循环引用的小技巧。
文章探究了一个有趣的问题:将质数绘制在极坐标系中能看出什么规律?作者用 sympy 库生成质数,用 matplotlib 作可视化,最后出现一个美丽的图案!如何解释它呢?

前1万个质数的坐标图
MCP 协议用在大模型和数据源间建立安全双向的链接,这到底意味着什么?它的出现能解决什么问题?作者详细演示了官方示例的步骤,解释了数据交互的过程,并用真实数据集做测试,可以看出 MCP 还是很有用的。(附:关于使用 MCP 开发的反思 )
1、markitdown: 将各种文件转换为 Markdown 格式
微软最新开源的热门项目,支持将各类文件转换为 Markdown 格式,除了 office 三件套,还支持 pdf、图片、音频、HTML、CSV、JSON、XML、ZIP 文件等。(star 24.3K)(附:一个利用 markitdown 实现的在线网站 office 文件转 Markdown)
2、systemd-pilot:用于管理 systemd 服务的桌面程序
一个用于管理 GNU/Linux 系统上 systemd 服务的桌面应用,支持查看、筛选、启动、停止、重启服务,支持用模板快速部署、简单搜索、全面集成到 GNOME 桌面。
Python 全栈项目,一个功能齐全的电商平台,具有强大的管理员面板和现代的用户界面,支持多图上传、购物车、愿望单、仪表板、PDF 发票、销售跟踪等功能。

用 Python 开发的一站式 AI 影视解说与自动化剪辑工具,利用 LLM 撰写文案、自动化剪辑/配音/生成字幕,助力高效的内容创作。(star 2.6K)
腾讯家的视频大模型,已开源文本生成视频、待支持图像生成视频。(star 6.4K)
6、SeleniumBase:网络自动化、测试以及绕过机器人检测
一站式浏览器自动化框架,支持网页抓取、自动化测试、爬虫、绕过验证码等功能。(star 7.1K)
7、BlackSheep:快速的 Python ASGI Web 框架
一个异步 Python Web 框架,构建基于事件的应用。受到 Flask、ASP.NET Core 的启发。(star 2K)
8、PDFMathTranslate:基于 AI 的 PDF 文档全文双语翻译
Python 开发的 PDF 文档翻译及双语对照工具,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker,保留公式、图表、目录和注释。(star 10K)
9、cookbook:谷歌 Gemini API 的示例和指南
官方发布的一系列关于 Gemini API 的指南和示例。Gemini 模型支持多模态,可在文本、图像、代码和音频之间无缝推理。(star 9K)
10、tkforge:用 Figma 轻松创建 Python GUI
类似于 Tkinter Designer,在 Figma 中通过拖拽方式创建 GUI项目,用这个工具转换为可执行的 Python 代码。
11、MegaParse:利用 LLM 无损解析 PDF、Docx、PPTx
功能强大且灵活的解析器,可轻松处理各种类型的文档,无信息丢失、快速高效。(star 4.6K)
一款基于 Markdown 的笔记应用,具有任务管理功能。界面简洁,多种主题,支持任务、图片、文件和代码片段。

Python 潮流周刊#32:打造个人的新闻聚合阅读器 (2023.12.23)
技术周刊是聪明人在信息过载时代中筛选优质知识的聪明手段。这是一个专为国内 Python 开发者量身打造的资讯平台,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等丰富内容。立即订阅,每周将收到一篇文章推送,每周进步一点点。
欢迎留言,说说你最喜欢本期的哪一则分享?大家反馈得越多,我今后分享的也会越多!
欢迎将本专栏分享给同样爱学习的同学,当有人通过你分享的海报或者链接,购买了专栏,那么你将获得高额的返利。
万字浓缩版,Python 潮流周刊第 1 季的 800 个链接!