← ความรู้

Interactive · AI Basic

AI ที่เห็น ฟัง และสร้างได้

Multimodal AI — นอกจาก text ยังมี image, audio, video ต่างค่าย เก่งต่างด้าน

1

AI เหมือนทีมฝีมือ

แต่ละคนเก่งคนละด้าน

🎨

อุปมา: AI text = นักเขียน, AI ภาพ = จิตรกร, AI เสียง = นักดนตรี, AI วิดีโอ = ผู้กำกับ — ต่างคนต่างฝีมือ ไม่มีใครทำได้ทุกอย่างเก่งเท่ากัน

กดแต่ละใบเพื่อดูรายละเอียด

2

ทำอะไรได้บ้างจริงๆ

ตัวอย่าง use case แต่ละแบบ

💡

AI บางตัวเข้าใจ หลาย modality พร้อมกัน — เช่น GPT-4o รับทั้งรูป + เสียง + text = ต่อไป "AI พูด video call กับคุณได้จริงๆ"

3

เลือกค่ายไหนดี

ระดับปัจจุบัน (เม.ย. 2026)

🎯

ของ free tier เทียบกัน: ChatGPT มีครบสุด (text + image + voice) — แต่คุณภาพแต่ละ modality อาจแพ้ specialist ในด้านนั้น

← กลับไปหน้าความรู้