「AIの創世記」(5/18) ลงทุนนวัฒกรรมการพัฒนา AI ทุ่มเท
เรา นักพัฒนา AI จะประเมิน AI ที่เราได้ “เป่าชีวิตเข้าไป” เหมือนกับพระเจ้าที่ประเมินสิ่งที่สร้างขึ้นในช่วงปฐมบท และตัดสินความดีงามของมัน
แต่การให้ AI เองเป็นผู้ตัดสินว่า “ดี” หรือ “ไม่ดี” ตามมาตรฐานของมนุษย์นั้นเป็นเรื่องที่ยาก
ตัวอย่างเช่น มีตัวชี้วัดเชิงคณิตศาสตร์อย่างคะแนน F1 และเส้น ROC เป็นต้น แต่เพียงเท่านั้นอาจไม่สะท้อนเจตนาและค่านิยมของผู้พัฒนาเช่น “จะใช้งานอย่างไร” และ “ต้องการให้ทำงานภายใต้เงื่อนไขแบบไหน” ได้ทั้งหมด
วิธีการเรียนแบบตำราเรียนบางแบบที่สอนให้ AI เห็นภาพ “การเคลื่อนไหวครั้งใหญ่หลังแท่งเทียนหนึ่งแท่ง” จะทำให้ได้ความแม่นยำสูง แต่สำหรับ AI ที่ใช้ในการเทรดรายวัน จุดเข้าซื้อขายมีน้อยเกินไปจนใช้งานจริงไม่ได้ หากให้ AI ประเมินกันเองแล้ว โมเดลนี้อาจถูกยกย่องว่า “แม่นยำสูง จึงยอดเยี่ยม”
สุดท้ายการตัดสินใจรับหรือไม่รับใช้งานจำเป็นต้องมีกรอบการประเมินที่ผู้พัฒนากำหนดเองว่า “อะไรสำคัญที่สุด” ซึ่งกรอบนั้นจะสะท้อนบุคลิกและวัตถุประสงค์ชัดเจน
สรุปกระบวนการเรียนรู้และประเมินผลของ AI ไม่สามารถเป็นไปได้ด้วย AI ที่มีโครงคิดเดียวกัน
มนุษย์ที่มีระดับการดำรงอยู่สูงกว่าสามารถสร้าง AI ที่ดียิ่งขึ้นได้
เมื่อพัฒนา AI ควรไม่ยึดติดกับการประเมิน AI ด้วยดัชนีทางกลไกหรือค่าอื่นๆ
โปรดดูค่าผลลัพธ์ที่ออกมาโดยตรงด้วยตาเปล่าและตรวจสอบว่าอะไรที่มันบ่งบอกเพื่อประเมิน AI