本課程旨在培訓學員使用 Python 建立生產級多模態 AI 系統,結合 Hugging Face 開源模型及 Gemini 雲端模型的強大功能。 學員將學習使用自有數據進行模型微調、實作發票辨識系統、建立 RAG 聊天機器人、開發 AI Agents,並透過 Model Context Protocol (MCP) 將 AI 能力暴露為標準化工具服務。 最後使用 Streamlit、FastAPI 及雲端平台進行應用部署。 課程專注於業界標準向量資料庫 FAISS,確保學員獲得深入、實用的技術掌握,而非淺層的工具接觸。
成功完成本課程後,學員將能夠:
Run multimodal inference using both Hugging Face and Gemini in Python
✅ Build an invoice recognition system using custom invoice images
✅ Build an embedding pipeline and semantic search system using FAISS
✅ Build an MCP Server that exposes FAISS retrieval and invoice OCR as tools, then connect it to a LangChain agent
🎯 Enterprise Multimodal AI Application
Includes:
Copyright © 2025 Unisoft Education Centre. All Rights Reserved