本課程以 AI Vibe Coding 方式,帶領學員使用 Python 快速建立可運作的 多模態 LLM Agent 應用。課程內容涵蓋 Hugging Face、Gemini、LangChain、RAG、FAISS、Gradio、FastAPI、Streamlit 及雲端部署流程。學員將學習如何處理 文字、PDF、圖片、音訊及影片,並將不同格式的資料轉化為可搜尋的知識內容, 透過 RAG 檢索增強生成 及 Agent 工具調用 建立智能應用。 課程最終將完成一個 Multimodal Customer Support Assistant 多模態客戶支援 Agent, 支援文件上載、圖片 OCR、影像描述、語音轉文字、影片音訊擷取、FAISS 語義搜尋、問題解答、問題摘要、疑難排解建議及升級處理建議。 學員亦會學習如何把應用拆分為 FastAPI Backend 與 Streamlit Frontend, 並在 Google Colab、Cloudflare Tunnel 及 Render 上進行測試及部署。
成功完成本課程後,學員將能夠:
Build and deploy a Hugging Face sentiment analyzer with Gradio and Hugging Face Spaces
Build a memory-enabled LangChain chatbot and an AI Agent that can call calculation/API tools
Build a FAISS-based RAG system that can search TXT, PDF, image OCR/caption, audio transcript and video transcript
🎯 Multimodal Customer Support Agent Application
Includes:
Copyright © 2025 Unisoft Education Centre. All Rights Reserved