GPT-5.5 + Codex เปิดตัววันนี้ — สิ่งที่ OpenAI ประกาศจริง ๆ
อัปเดต 24 เม.ย. 2026: OpenAI ปล่อยข้อมูล benchmark อย่างเป็นทางการแล้ว, API เปิดให้ใช้งานแล้ว (ทั้ง Standard และ Pro tier), context window ผ่าน API สูงสุด 1M tokens บทความนี้อัปเดตจากข้อมูลประกาศทางการล่าสุดแล้ว
วันที่ 23 เม.ย. 2026 OpenAI ประกาศ GPT-5.5 อย่างเป็นทางการ ปล่อยพร้อมกันทั้ง ChatGPT และ Codex โดยวางตำแหน่งว่าเป็น “a new class of intelligence for real work” — เน้นงานหลายขั้นตอน, การวางแผน, การเรียกเครื่องมือ, และ self-verification
ตอนเปิดตัววันแรก API ยังไม่พร้อม แต่ตอนนี้ API เปิดให้ใช้งานแล้ว ทั้ง Standard plan (สำหรับ API users ทั่วไป) และ Pro plan (สำหรับ Pro/Business/Enterprise) พร้อม benchmark ทางการที่ยืนยันว่า GPT-5.5 แรงกว่า GPT-5.4 ในทุกมิติ
TL;DR
- ใครใช้ได้ตอนนี้: Plus / Pro / Business / Enterprise ผ่าน ChatGPT UI และ Codex — API เปิดให้ใช้แล้ว ทั้ง Standard และ Pro tier
- Codex ได้อะไรใหม่: context window 400K tokens, Fast mode เร็วขึ้น 1.5 เท่า (ค่าใช้จ่าย 2.5 เท่า), และ browser use ที่กดใช้งาน web app จริง + ถ่ายภาพหน้าจอ + วนแก้ตามสิ่งที่เห็น
- ราคา API: Standard $5/M input, $30/M output — Pro $30/M input, $180/M output — Batch/Flex ลด 50%, Fast mode 2.5 เท่า
- Context ผ่าน API: สูงสุด 1M tokens (Codex ยังคง 400K)
- ฝั่งฮาร์ดแวร์: รันบน NVIDIA GB200 NVL72 rack-scale systems — ต้นทุนต่อล้าน token ต่ำลง 35 เท่า, output ต่อวินาทีต่อเมกะวัตต์สูงขึ้น 50 เท่า เทียบกับรุ่นก่อน
OpenAI วาง GPT-5.5 ไว้ตรงไหน
GPT-5.5 ไม่ได้มาแทน GPT-5.4 แบบคลีนสวีป แต่วางเป็น flagship สำหรับงานจริงจัง — โค้ดยาว ๆ ต่อเนื่อง, agent ที่ต้องใช้หลายเครื่องมือ, และ workflow ที่ต้องวางแผนเอง
ในฝั่ง ChatGPT เปิดให้ Plus ($20/เดือน) ใช้ได้เลย ส่วน GPT-5.5 Pro จะจำกัดอยู่ที่ Pro / Business / Enterprise เท่านั้น สำหรับ Codex ครอบคลุมถึง Go และ Edu ด้วย
ตอนนี้ OpenAI ปล่อย benchmark อย่างเป็นทางการแล้ว ยืนยันว่า GPT-5.5 ชนะ GPT-5.4 ทุกตัว:
| Benchmark | GPT-5.4 | GPT-5.5 |
|---|---|---|
| Terminal-Bench 2.0 | 75.1% | 82.7% |
| SWE-Bench Pro | 57.7% | 58.6% |
| GDPval | 83.0% | 84.9% |
| OSWorld-Verified | 75.0% | 78.7% |
| GeneBench | 19.0% | 25.0% |
| CyberGym | 79.0% | 81.8% |
จุดที่น่าสนใจ: Terminal-Bench 2.0 กระโดดจาก 75.1% เป็น 82.7% (+7.6%) และ GeneBench จาก 19% เป็น 25% (+6%) คือ gap ที่ใหญ่ที่สุด ส่วน SWE-Bench Pro ต่างกันแค่ 0.9% ซึ่งแทบไม่รู้สึก
นอกจากนี้ GPT-5.5 ยังมี Thinking mode (คล้าย reasoning mode) และ enhanced cybersecurity safeguards ผ่าน Trusted Access for Cyber program อีกด้วย
GPT-5.5 vs GPT-5.4 — เปรียบเทียบจากตัวเลขที่ประกาศ
| Factor | GPT-5.4 | GPT-5.5 |
|---|---|---|
| Context (Codex) | เดิม | 400K tokens |
| Context (API) | เดิม | 1M tokens |
| Fast mode | ไม่มี | เร็วขึ้น 1.5 เท่า (ค่าใช้จ่าย 2.5 เท่า) |
| Browser use | จำกัด | ขยาย — คลิก, ถ่ายภาพหน้าจอ, iterate |
| API Standard | baseline | $5 / $30 ต่อ M (input/output) |
| API Pro | ไม่มี | $30 / $180 ต่อ M (input/output) |
| Batch/Flex | baseline | 50% ของราคา Standard |
| API cached input | baseline | $0.50 / M tokens |
| API availability | พร้อมใช้ | พร้อมใช้แล้ว |
จุดที่ต้องอ่านให้เข้าใจตรง ๆ: ราคาขึ้น 2 เท่า ไม่ใช่ 30% หรือ 4 เท่า OpenAI ยืนยันว่าโมเดลใหม่ใช้ token น้อยลงสำหรับงานเดียวกัน เลยอาจคุ้มกว่าเมื่อนับเงินจริง แต่ ยังต้องพิสูจน์จากการใช้งานจริง ไม่ใช่เชื่อตามเอกสาร launch
ส่วน cached input ราคา $0.50/M tokens น่าสนใจสำหรับใครที่ทำ agent ที่มี system prompt ยาว ๆ ซ้ำ ๆ — ประหยัดได้เยอะถ้าออกแบบ prompt ให้ cache-friendly
4 สิ่งใหม่ใน Codex ที่ควรรู้
400K context window (Codex) / 1M tokens (API) — Codex ใหญ่พอจะใส่ repo ขนาดกลางเข้าไปทั้งก้อน ส่วน API ไปไกลถึง 1M tokens เทียบกับ Claude Sonnet ที่อยู่ราว 200K และ Gemini Pro ที่ไปถึง 2M ผ่าน Vertex AI — GPT-5.5 ผ่าน API ตอนนี้เป็นอันดับสองในเรื่อง context window
Fast mode — generate token เร็วขึ้น 1.5 เท่า แลกกับค่าใช้จ่าย 2.5 เท่า เหมาะกับงาน interactive ที่คนนั่งรอคำตอบ ไม่ใช่ batch ที่รันทิ้งไว้
Browser use ที่ขยายแล้ว — Codex สามารถคลิกผ่าน web app จริง, ถ่ายภาพหน้าจอ, แล้ววนแก้ตามสิ่งที่เห็น นี่คือก้าวสำคัญสำหรับ agent ที่ต้อง test UI หรือทำงานบนเว็บที่ไม่มี API
ตำแหน่งเป็น agent ที่ “ทำงานจริง” — OpenAI เน้นว่า multi-step task, self-verification, tool use ดีขึ้น ซึ่ง benchmark ทางการยืนยันแล้ว โดยเฉพาะ Terminal-Bench 2.0 ที่กระโดดจาก 75.1% เป็น 82.7% และ OSWorld-Verified จาก 75% เป็น 78.7%
เทียบกับ Claude Sonnet / Gemini Pro — เชิงคุณภาพ
| Factor | GPT-5.5 (Codex) | Claude Sonnet | Gemini Pro (Vertex) |
|---|---|---|---|
| Context | 400K (Codex) / 1M (API) | ประมาณ 200K | 2M (ผ่าน Vertex) |
| Agent / Tool use | เน้นเป็น agent, browser use ชัด | แข็งทั้ง chat + tool | มีแต่ workflow แยก |
| พร้อมใช้งานผ่าน API | พร้อมใช้แล้ว (Standard + Pro) | พร้อมใช้ | พร้อมใช้ผ่าน Vertex / AI Studio |
| ราคา | Standard $5/$30 — Pro $30/$180 ต่อ M | แตกต่างตาม tier | แตกต่างตาม tier |
ตารางนี้เจตนาให้ qualitative เพราะการเทียบแบบ apples-to-apples ข้ามเจ้ายังเสี่ยง — benchmark ของแต่ละเจ้าวัดคนละชุด และ pricing ฝั่งคู่แข่งก็ขึ้น/ลงตาม tier + region ใครจะเอาไปใช้ทำงานจริง แนะนำให้ลองรัน prompt ของตัวเองเทียบ 3 เจ้าด้วย workload จริง
ข้อดี / ข้อด้อย — จากข้อมูลที่ประกาศ
ข้อดี
- +Context 400K (Codex) / 1M (API) — ใส่ repo ขนาดกลางถึงใหญ่ได้ทั้งก้อน
- +Benchmark ทางการยืนยัน — ชนะ GPT-5.4 ทุกตัว โดยเฉพาะ Terminal-Bench +7.6%
- +API เปิดแล้วทั้ง Standard และ Pro tier — พร้อมใช้งานได้เลย
- +Fast mode 1.5 เท่าเหมาะกับงาน interactive coding
- +Browser use ขยายแล้ว — คลิก UI จริง + ถ่ายภาพหน้าจอได้
- +Token efficiency ดีขึ้น — ใช้ token น้อยลงสำหรับงานเดียวกัน ช่วยหักลบราคาที่แพง
- +Batch/Flex ลด 50% จาก Standard — ถูกมากสำหรับงาน batch
- +Cached input $0.50/M ถูกกว่า input ปกติ 10 เท่า
ข้อเสีย
- −ราคา Standard ขึ้น 2 เท่าจาก GPT-5.4 — Pro tier แพงกว่าอีก 6 เท่า
- −ต้อง subscribe Plus/Pro ขึ้นไป ($20/เดือน+) เพื่อใช้ผ่าน UI
- −GPT-5.5 Pro จำกัดที่ Pro / Business / Enterprise เท่านั้น
- −SWE-Bench Pro ต่างจาก GPT-5.4 แค่ 0.9% — ไม่ชัดสำหรับงาน coding ทุกรูปแบบ
ค่าใช้จ่ายที่ควรคิดเผื่อ
สำหรับ dev ไทยที่คิดจะใช้ GPT-5.5 ผ่าน API ต้องเตรียมคำตอบ 3 คำถามนี้ก่อน
หนึ่ง — workflow ของคุณได้ประโยชน์จาก cached input จริงไหม? ถ้า system prompt ยาวและใช้ซ้ำทุก call ราคา $0.50/M อาจประหยัดได้เยอะกว่าที่คิด แต่ถ้า prompt เปลี่ยนทุก request ก็ไม่ได้ใช้
สอง — Fast mode คุ้มที่จะจ่าย 2.5 เท่าไหม? คำตอบคือ “ก็ต่อเมื่อมีคนรอคำตอบ” สำหรับ batch job ที่รันทิ้งไว้ช่วงกลางคืน ปกติก็พอ
สาม — คุณพร้อมย้ายจากโมเดลปัจจุบันตอนไหน? ตอนนี้ API เปิดแล้ว แต่ GPT-5.4 ยังใช้งานได้ปกติ ถ้ายังไม่มีเคสที่ 1M context หรือ benchmark ที่ดีกว่าจำเป็นจริง ๆ ลองทดสอบกับ workload จริงก่อนย้าย production
ใครควรใช้ / ใครยังไม่ต้องรีบ
เหมาะกับ
- Plus / Pro subscriber ที่ใช้ ChatGPT / Codex ทุกวัน — ได้ใช้ฟรีในราคา subscription เดิม
- ทีมที่ทำ agent ต้องคลิกผ่าน web app / ทดสอบ UI — browser use ใหม่ตอบโจทย์ชัด
- Codebase ขนาดกลางถึงใหญ่ที่อยากให้ Codex อ่านทั้งก้อน — 400K (Codex) หรือ 1M (API)
- ทีมที่พึ่งพา API และพร้อมย้ายจาก GPT-5.4 — API เปิดแล้ว ทดสอบได้เลย
ลองชั่งน้ำหนักดู
- Startup ไทยที่คิดค่าใช้จ่ายเป็นเงินบาท — ราคา Standard 2 เท่า / Pro 6 เท่า ต้องทดสอบ token efficiency ก่อน
- ทีมที่ใช้ Batch/Flex ได้ — ลด 50% จาก Standard อาจคุ้มกว่า GPT-5.4 เมื่อรวม token efficiency
ข้ามได้เลย
- Solo dev / hobby project — GPT-5.4 หรือโมเดล open-weight ยังใช้งานได้และถูกกว่า
- งานที่ไม่ต้องการ agent / tool use — GPT-5.5 มีจุดขายหลักที่ส่วนนี้ ถ้าไม่ใช้ก็ไม่คุ้ม
Verdict
GPT-5.5 ดูเป็นการเพิ่ม ความสามารถของ agent มากกว่าการอัปเกรดโมเดลทั่วไป — 400K context, Fast mode, browser use ที่ขยาย ทั้งหมดนี้เน้นคนที่ใช้ Codex หรือเขียน agent จริงจัง ไม่ได้เพิ่มประสิทธิภาพ chat แบบรู้สึกได้ทันที
ในเชิงราคา การขึ้น 2 เท่าแรงกว่าที่ตลาดคุ้น แต่ถ้า token efficiency ดีขึ้นจริงตามที่ OpenAI อ้าง บิลสุดท้ายอาจไม่ต่างจากเดิมเท่าไหร่ ต้องใช้จริงแล้ววัดเอง
ฝั่งฮาร์ดแวร์ที่รันบน NVIDIA GB200 NVL72 เป็นรายละเอียดที่น่าสนใจสำหรับ infrastructure-minded people — ต้นทุนต่อ token ที่ต่ำลง 35 เท่า และ throughput ต่อเมกะวัตต์ที่สูงขึ้น 50 เท่า คือเหตุผลว่าทำไม OpenAI ถึงกล้าวางโมเดลใหญ่กว่าไว้ในราคาที่ยังพอคุย
สำหรับ dev ไทยที่มี Plus subscription อยู่แล้ว — เปิดใช้งานใน ChatGPT / Codex ได้เลยวันนี้ ส่วนทีมที่จะย้าย production API — เปิดให้ใช้แล้วทั้ง Standard และ Pro tier ทดสอบด้วย workload จริงของตัวเองได้เลย
Benchmark ทางการยืนยันว่า GPT-5.5 แรงกว่า GPT-5.4 ในทุกมิติ โดยเฉพาะ Terminal-Bench 2.0 (+7.6%) และ GeneBench (+6%) แต่ SWE-Bench Pro ต่างแค่ 0.9% ซึ่งอาจไม่รู้สึกสำหรับงาน coding ทั่วไป จุดขายที่ชัดกว่าตัวเลข benchmark คือ latency ที่เทียบเท่า GPT-5.4 แต่ใช้ token น้อยลง และ reasoning ที่ดีขึ้นสำหรับงานต่อเนื่องยาว ๆ
บทความนี้อัปเดตล่าสุด 24 เม.ย. 2026 จากประกาศทางการของ OpenAI เราจะกลับมาอัปเดตอีกรอบหลังจากได้ลองใช้จริงกับ codebase ของตัวเองพอสมควรแล้ว