本週從 GitHub Trending 前 15 名中,篩選出 15 個 AI/LLM 相關專案:


1. mvanhorn/last30days-skill

→ GitHub 連結

mvanhorn/last30days-skill 是一個基於 AI Agent 的創新技能,旨在革新我們獲取最新資訊的方式。它能即時抓取 Reddit、X、YouTube、Hacker News、Polymarket 等多個主流社群平台及網路的內容,並以使用者實際的互動(如點讚、投票、甚至 Polymarket 上的資金投注)作為資訊價值判斷的核心依據。這解決了傳統搜尋引擎常面臨的資訊滯後與社群脈絡缺失問題,尤其在 AI/LLM 這樣瞬息萬變的領域,能快速掌握「人們真正在討論什麼」至關重要。

這個專案的魅力在於其強大的資料整合能力,它能將分散在各「圍牆花園」中的碎片化資訊,透過智慧搜尋與合成,提煉成一份具體、有引用來源且以社群相關性而非 SEO 優先的摘要。對於 AI/LLM 領域的開發者與研究者而言,last30days-skill 不僅提供了獨特的社群洞察力,幫助我們追蹤最新技術趨勢、評估工具實用性,更是展示了 AI Agent 如何有效橋接多元數據源,提供超越傳統搜尋深度的資訊價值。這是一個理解世界「真實聲音」的強大工具。


2. apple/container

→ GitHub 連結

apple/container 是 Apple 專為 Apple silicon Mac 設計的原生容器工具。它以 Swift 編寫,利用輕量級虛擬機,提供高效能 Linux 容器環境,滿足 Mac 用戶對原生容器化效率的期待。

對於 AI/LLM 開發者,此專案至關重要。AI 開發常見複雜依賴管理,apple/container 提供隔離、可重現的高效環境,大幅簡化設定與部署。針對 Apple silicon 的優化,確保在本地進行模型訓練與推論時,擁有更佳效能與流暢體驗,為 macOS 上的 AI 應用構建提供堅實基石。


3. phuryn/pm-skills

→ GitHub 連結

phuryn/pm-skills 是一個為產品經理量身打造的 AI 作業系統,旨在解決通用 AI 僅提供文字而缺乏結構化指導的問題。它將 Teresa Torres、Marty Cagan 等業界知名產品專家的框架,轉化為超過百種代理式技能、指令與插件,涵蓋從產品探索、策略制定、執行到發佈和成長的全週期,引導 PM 依循專業方法論做出更明智的決策。在 AI/LLM 領域,pm-skills 專案展示了大型語言模型如何從單純的文字生成器,進化為能夠執行複雜、領域特定工作流程的智能代理。它不僅與 Claude 生態系深度整合,也支援 OpenAI Codex、Gemini 等多種 AI 助手。其設計清晰的技能、指令與插件架構,為 AI 應用於垂直領域提供了實用範例。特別值得關注的是 pm-ai-shipping 插件,它為 AI 生成程式碼後難以追溯「意圖」的問題提供了創新解決方案,是探索 LLM 在軟體開發生命週期中潛力的重要一步。


4. chopratejas/headroom

→ GitHub 連結

Headroom 是一個專為 AI 代理和 LLM 應用設計的上下文壓縮層。它巧妙地在資料到達大型語言模型之前,對工具輸出、日誌、RAG 區塊、檔案和對話歷史進行高效壓縮。其核心優勢在於能將 Token 使用量減少 60% 至 95%,同時聲稱保持回答的準確性。這個專案提供多種模式,包括直接函式庫、零程式碼變更的代理(Proxy)模式,以及針對主流編碼代理的包裹器(Wrapper),讓開發者能以靈活的方式整合。此外,它還支援跨代理記憶體共享和錯誤學習機制,進一步優化了多代理協作的效率。


5. NVIDIA/SkillSpector

→ GitHub 連結

NVIDIA 推出的 SkillSpector 是一款專為 AI 代理技能(Agent Skills)設計的安全掃描工具,旨在解決當前 AI 應用中日益嚴峻的信任問題。隨著 AI 代理如 Claude Code、Gemini CLI 等日益普及,其所使用的技能往往在未經充分審查的情況下被安裝與執行,研究顯示其中高達 26.1% 含有漏洞,甚至 5.2% 具惡意意圖。SkillSpector 正是為此而生,協助使用者在安裝前判斷這些技能是否安全。

對於 AI/LLM 技術社群而言,SkillSpector 絕對是值得關注的專案。它涵蓋了 16 大類共 64 種漏洞模式,從提示詞注入 (Prompt Injection)、資料外洩 (Data Exfiltration)、供應鏈風險到工具濫用等,深度分析潛在威脅。其獨特的兩階段分析機制——結合快速靜態分析與選配的 LLM 語義評估——不僅能有效提升檢測準確度,還能過濾誤報並提供清晰的解釋,為 AI 代理生態系的安全提供了強而有力的保障。


6. addyosmani/agent-skills

→ GitHub 連結

在 AI 輔助開發日趨成熟的今天,addyosmani/agent-skills 專案為 AI 編碼代理帶來了「生產級別」的工程技能,堪稱一股清流。它解決了目前 AI 代理常遇到的核心問題:為求快速,它們往往會忽略規格制定、測試撰寫、安全審查等資深工程師習以為常的嚴謹流程。

這個專案透過一系列精心設計的「技能」(以 Markdown 格式呈現),將軟體開發生命週期中的每個階段——從需求定義、規劃、編碼、測試、審查到部署——標準化為可執行的工作流程。每個技能都內建了具體的步驟、品質門檻,甚至還有「反合理化」機制,確保 AI 代理不會輕易跳過關鍵環節。它將 Google 等頂尖公司的工程實踐內化為代理的行為模式,例如測試金字塔、Trunk-based 開發等。

對於 AI/LLM 技術社群而言,agent-skills 的價值在於它將 LLM 從單純的程式碼生成器,提升為能夠遵循業界最佳實踐、交付高品質程式碼的真正工程夥伴。其模組化的設計,支援多種主流 AI 開發工具,讓我們能以更可控、更值得信賴的方式,將 AI 融入專業的軟體開發流程中,這對於提升 AI 輔助開發的實用性和可靠性,無疑是重要的一步。


7. Panniantong/Agent-Reach

→ GitHub 連結

「Panniantong/Agent-Reach」為 AI Agent 賦予了「網際網路視角」,專為解決 Agent 難以讀取與搜尋 Twitter、YouTube、Reddit、小紅書等平台內容的痛點。傳統方式常受限於 API 費用、封鎖或複雜配置,此專案透過整合多種開源工具與免費介面,自動替 Agent 選型、安裝並維護最穩定的存取途徑。它不僅完全免費、保障隱私,更持續追蹤平台變化以確保可用性,兼容各種主流 Agent。這讓 AI Agent 能擺脫靜態資料限制,直接從活生生的網路獲取即時資訊,對於提升 Agent 的實際應用能力至關重要,為 AI 進入 Web 4.0 時代鋪平道路。


8. openai/plugins

→ GitHub 連結

由 OpenAI 官方維護的 openai/plugins 專案,提供了一系列基於 Codex 模型(或廣義的 AI 模型)的外掛範例。它旨在解決 AI 模型與現實世界應用之間互動的關鍵問題,讓大型語言模型不再僅限於生成文字,更能實際「操作」外部服務,將 AI 的潛力從語言智能延伸至具體行動。

這個儲存庫展示了 AI 如何透過插件調用特定工具、執行指令,進而自動化複雜任務。例如,它包含了用於 Figma 的程式碼轉設計、Notion 的規劃與知識管理、甚至是 iOS/macOS/Web 應用程式的開發與偵錯等豐富範例。每個外掛都具備清晰的架構,包含必要的 manifest 檔案與可選的輔助資源,提供了實用的整合思路。

在 AI/LLM 領域,openai/plugins 值得關注的原因在於,它為 AI 成為真正的「智能代理人」提供了具體的藍圖和實踐。它揭示了未來 LLM 的發展方向:從純粹的語言理解與生成,走向與外部環境的深度整合與行動執行。對於希望打造 AI 驅動自動化工作流的開發者來說,這是一份極具價值的資源,提供了從概念到實作的清晰路徑。


9. Leonxlnx/taste-skill

→ GitHub 連結

Taste-Skill - gives your AI good taste. stops the AI from generating boring, generic slop
Taste Skill
The Anti-Slop Frontend Framework for AI Agents

Portable Agent Skills that upgrade AI-built interfaces: stronger layout, typography, motion, and spacing instead of boilerplate-looking UIs. This repo also includes image-generation skills for reference boards (web, mobile, brand kits). Pair them with ChatGPT Images or similar generators, then hand the frames to Codex, Cursor, or Claude Code for implementation.

Disclaimer
Taste Skill has no official token, coin, or crypto project. Any token using my name, image, or project is unaffiliated and not endorsed by me.
Disclaimer · Install · Skills · Settings · Examples · Sponsor · Research · FAQ · License
Feedback & Contributions
We would love your feedback. Suggestions and bug reports:

Open a Pull Request or Issue on GitHub
DM @lexnlin or @blueemi99
Email us at hello@tasteskill.dev

Installing
The npx skills add CLI scans the skills/ folder in this repo, so all skills below (code and image-generation) install the same way.
npx skills add https://github.com/Leonxlnx/taste-skill

Install a single skill by its install name (the name: field inside the SKILL frontmatter, not the folder name):
npx skills add https://github.com/Leonxlnx/taste-skill –skill “design-taste-frontend”

You can also copy any SKILL.md into your project or paste it into ChatGPT / Codex conversations.
Updating from the previous version
The default taste-skill (install name design-taste-frontend ) is now v2 (experimental) , a substantial rewrite of the original v1. If you already have v1 installed, just re-run the install command and you will be upgraded:
npx skills add https://github.com/Leonxlnx/taste-skill –skill “design-taste-frontend”

The install name did not change, so no script updates are needed. The newer SKILL.md replaces the older one in place.
If you depend on the exact behavior of v1 and want to pin to it explicitly:
npx skills add https://github.com/Leonxlnx/taste-skill –skill “design-taste-frontend-v1”

See CHANGELOG.md for the full v1 to v2 diff and the rationale.
Skills
Each skill does one job; you do not need all of them at once. Implementation skills output code. Image-generation skills output reference images only.
The Install name column is the exact value you pass to –skill .

Skill (folder)  
Install name  
Description  




taste-skill  
design-taste-frontend  
🆕  v2 (experimental)  - substantial rewrite of the default skill. Reads the brief, infers the design language, tunes three dials (VARIANCE / MOTION / DENSITY). Brief inference, design-system map, hard em-dash ban, canonical GSAP code skeletons, redesign-audit protocol, strict pre-flight check. Actively iterating toward v2.0.0 stable.  


taste-skill-v1  
design-taste-frontend-v1  
The original v1 of taste-skill, preserved for projects depending on its exact behavior. Use only if the v2 default breaks something specific in your workflow.  


gpt-tasteskill  
gpt-taste  
Stricter variant for GPT/Codex: higher layout variance, stronger GSAP direction, aggressive anti-slop.  


image-to-code-skill  
image-to-code  
Image-first pipeline: generate site references, analyze them, then implement the frontend to match.  


redesign-skill  
redesign-existing-projects  
Existing projects: audit the UI first, then fix layout, spacing, hierarchy, styling.  


soft-skill  
high-end-visual-design  
Polished, calm, expensive UI with softer contrast, whitespace, premium fonts, spring motion.  


output-skill  
full-output-enforcement  
When the model ships half-finished work: full output, no placeholder comments.  


minimalist-skill  
minimalist-ui  
Editorial product UI (Notion/Linear vibes), restrained palette, crisp structure.  


brutalist-skill  
industrial-brutalist-ui  
Hard mechanical language: Swiss type, sharp contrast, experimental layout.  


stitch-skill  
stitch-design-taste  
Google Stitch-compatible rules, including optional  DESIGN.md  export format.  

Image generation skills
These produce design images only (no code). Use with ChatGPT Images, Codex image mode, or any agent that generates images.

Skill (folder)  
Install name  
Description  




imagegen-frontend-web  
imagegen-frontend-web  
Website comps: hero, landing, multi-section with strong typography, spacing, anti-slop art direction.  


imagegen-frontend-mobile  
imagegen-frontend-mobile  
Mobile screens and flows: iOS/Android/cross-platform, mockups, readable type, coherent sets.  


brandkit  
brandkit  
Brand-kit boards: logo directions, palettes, type, identity applications across categories.  

Which one should I use?

Start with taste-skill for the safest general default. (Now v2 experimental - see what changed in the CHANGELOG .)
If you depend on the exact behavior of the original taste-skill, install taste-skill-v1 instead.
Use gpt-taste when you want the stricter GPT/Codex-oriented rules and motion/layout enforcement.
Use image-to-code-skill for image → analyze → code website workflows.
Use redesign-skill to improve an existing codebase instead of greenfield styling.
Add soft-skill , minimalist-skill , or brutalist-skill when the visual direction is already chosen.
Add output-skill if the agent keeps truncating output.
Use imagegen-frontend-web , imagegen-frontend-mobile , or brandkit when the deliverable is images (comps, flows, identity boards), then pass results to your coding agent.

Image-first tip
For image-to-code-skill , state the pipeline in the prompt, e.g.: follow the skill: generate images, then analyze, then code .
ChatGPT Images and Codex
Attach or paste imagegen-frontend-web , imagegen-frontend-mobile , or brandkit and ask for the frames you need, then feed the renders to Codex, Cursor, or Claude Code. Use image-to-code-skill when you want one workflow that both generates references and implements the site in code.
Settings (taste-skill only)
Numbers at the top of the file are 1-10 dials:

DESIGN_VARIANCE : Layout experimentation (lower: centered/clean · higher: asymmetric/modern).
MOTION_INTENSITY : Animation depth (lower: hover · higher: scroll/magnetic).
VISUAL_DENSITY : Information per viewport (lower: spacious · higher: dense dashboards).

Examples
Created with taste-skill:

Support the project
If Taste Skill helps you, consider sponsoring:
Sponsor on GitHub
Current Sponsors

Research
Background writing that shaped these skills lives in research/ .
Star History

Common Questions
How is this different from other AI design skills? Multiple specialized variants, adjustable dials in key skills, anti-repetition rules informed by dedicated research. All are framework agnostic across major coding agents.
Does it work with React, Vue, Svelte? Yes. Rules target design intent, not a single framework API.
What is SKILL.md ? A portable instruction file agents can load automatically; install via npx skills add or by copying into a repo or conversation.
Do image-generation skills install with npx skills add ? Yes. They live under skills/ alongside the code skills so the same CLI discovers them.
License
MIT License · Copyright (c) 2026 Leonxlnx


10. microsoft/markitdown

→ GitHub 連結

microsoft 的 markitdown 是一個值得 AI/LLM 技術社群關注的 Python 工具,它旨在解決將多種文件與檔案(如 PDF、Word、Excel、圖像、音訊,甚至 YouTube 連結)轉換為 LLM 友善 Markdown 格式的資料前處理挑戰。當我們需要將大量非結構化資料餵給大型語言模型進行分析或訓練時,MarkItDown 能有效抽取並保留原文的重要結構(如標題、列表、表格),將其標準化為 LLM 原生「理解」且高度詞元效率的 Markdown 文本。

其亮點在於深度整合 AI 功能,不僅能運用 LLM 進行圖片內容描述,更可透過 markitdown-ocr 插件實現影像 OCR,或結合 Azure Content Understanding 進行多模態資料(如音訊、影片)的高品質結構化提取。這大大簡化了為 RAG 應用、AI 內容理解或任何文本分析管道準備資料的流程,確保輸入 LLM 的資料既有結構又易於解析,從而提升模型表現。對於需要處理異構資料源的 AI 開發者來說,這無疑是一個實用且強大的利器。


11. refactoringhq/tolaria

→ GitHub 連結

Tolaria 是一款開源的跨平台桌面應用程式,旨在幫助用戶高效管理基於 Markdown 的個人知識庫與企業文件。它強調「檔案優先」、「Git 優先」和「離線優先」的原則,確保用戶數據完全掌控在自己手中,不受應用程式綁定,並能透過 Git 享受完整的版本控制。對於 AI/LLM 領域的開發者和研究者而言,Tolaria 尤其值得關注。它被設計為「AI-first but not AI-only」,能夠將整理好的 Markdown 筆記作為 AI 代理的上下文(context)輸入,儲存 AI 助理的記憶與操作流程,甚至提供專用的 AGENTS 文件供 AI 代理理解其運作。這種標準化的資料儲存方式,使得它成為構建個人或團隊 AI 驅動知識管理系統的理想基礎,讓你的 AI 能更智慧地存取與理解你的資料。


12. lfnovo/open-notebook

→ GitHub 連結

lfnovo/open-notebook 是一個值得關注的開源專案,作為 Google Notebook LM 的私有化、功能更豐富的替代方案。在 AI 應用普及的今天,許多使用者開始關注資料隱私和對工具的控制權。Open Notebook 強調 100% 本地運行,讓你的研究資料完全掌握在自己手中,解決了雲端服務的資料主權疑慮。它在 AI/LLM 領域的亮點在於其驚人的彈性。專案支援超過 18 種 AI 模型供應商,包括 OpenAI、Anthropic、以及本地部署的 Ollama、LM Studio,讓使用者能根據需求選擇最佳模型,兼顧性能與成本。無論是整合 PDF、影音、網頁等多模態內容進行智慧搜尋、上下文聊天、AI 輔助筆記,甚至專業級多講者播客生成,Open Notebook 都提供強大功能。對於追求資料安全、客製化,並希望避免廠商鎖定的技術使用者而言,這是一個極具潛力的工具,完整的 REST API 和 Docker 部署也為開發者提供了極大便利。


13. aaif-goose/goose

→ GitHub 連結

Goose 專案 (aaif-goose/goose) 是一個令人振奮的開源 AI 代理,它超越了傳統的程式碼建議,旨在為使用者提供一個能在本地機器上執行、功能多樣的智能夥伴。它不只支援程式碼生成、執行、編輯與測試,更延伸至研究、寫作、自動化及資料分析等廣泛領域。Goose 以 Rust 打造,具備桌面應用程式、CLI 及 API 等多種形式,確保高效能與優異的可攜性。

其核心亮點在於其「LLM 無關性」,支援超過 15 家 LLM 供應商,包含 OpenAI、Anthropic、Google 及 Ollama 等,並透過 Model Context Protocol 標準連接 70 多種擴充功能,極大化了其彈性與擴展性。作為 Linux 基金會旗下 Agentic AI Foundation 的一員,Goose 的開放治理模式和社群驅動特性,使其在 AI 代理生態系中佔據獨特地位,值得持續關注其在實現真正自主 AI 任務方面的潛力。


14. opencv/opencv

→ GitHub 連結

OpenCV (Open Source Computer Vision Library) 無疑是電腦視覺領域的基石,它解決了機器如何「看見」並理解世界的根本問題。這個跨平台、高效能的函式庫,讓開發者能輕鬆實作各種影像處理、特徵偵測、物體辨識、乃至於機器學習相關的功能。在AI與LLM技術快速發展的今日,OpenCV的地位依然關鍵。它雖然不是大型語言模型本身,卻是許多AI應用處理視覺資料的基礎。無論是為AI模型準備高品質的訓練數據(例如圖像增強、裁剪、預處理),或是將複雜的視覺資訊轉換為AI/LLM能理解的輸入(例如從影像中提取物體特徵或上下文以生成文字描述),OpenCV都扮演著不可或缺的角色。對於希望構建多模態AI、機器人視覺、智慧監控等系統的開發者來說,掌握OpenCV是連接視覺與智慧決策的橋樑。


15. roboflow/supervision

→ GitHub 連結

Roboflow 的 supervision 是一個專為電腦視覺(CV)開發者打造的開源工具包,旨在簡化 CV 應用程式開發。它提供一系列模型無關(model-agnostic)的實用工具,涵蓋從資料處理(如多格式資料集操作)、模型推理到結果視覺化的各環節。它支援 Ultralytics、Hugging Face Transformers 等多種主流模型框架,並提供高度客製化的視覺化註解器,讓開發者能將更多精力專注於模型核心與應用邏輯,而非底層繁瑣的工具鏈整合。這套工具確實是加速 CV 專案開發的利器。

在 AI/LLM 領域快速發展的背景下,儘管 supervision 專注於 CV,其價值在於為多模態 AI 應用提供了核心視覺基礎設施。許多先進 AI 系統,特別是多模態模型,極需強大視覺處理能力來理解現實世界,supervision 透過提供高效、可重用的 CV 工具,加速了視覺元件與其他 AI 模組(如 LLM)的融合,提升了整體開發效率。這使其成為 AI 技術社群中,對於任何需要快速構建和部署視覺 AI 方案不可或缺的重要專案。