โดยความหมายเดิม LSTM คืออะไร Chapter 1 คำอธิบาย LSTM อย่างละเอียด (Chapter 1: พื้นฐานและกลไก)
สวัสดีครับ/ค่ะ เจ้าหน้าที่ลูกค้าของ OQ นะครับ/ค่ะ เนื่องจากนักพัฒนามีการอัปเดตใหญ่ จึงขอมาพร้อมกันนี้ เพื่อฝึกศึกษาเกี่ยวกับ LSTM สักหน่อยนะครับ/ค่ะ
ก่อนที่ทุกท่านจะเข้าสู่หัวข้อเรื่อง LSTM จะพูดถึงการเทรดและทุกคนเคยคิดบ้างไหมว่า “อยากเห็นอนาคตบ้างจัง”
ฉันเองก็เป็นหนึ่งในนั้นจริงๆ
ในด้านสถิติและความน่าจะเป็น ยิ่งความน่าจะเป็นสูงมากเท่าไร โอกาสที่เหตุการณ์ในอนาคตจะถูกต้องย่อมมากขึ้นตามไปด้วย ซึ่งทุกท่านคงทราบดี
ตัวอย่าง เช่น เขียนไฟลงบนกระดาษ จากนั้นคุณคิดว่าอีกไม่กี่นาที กระดาษจะเป็นอย่างไร
ความน่าจะเป็นที่กระดาษจะถูกเผาอยู่ที่ประมาณ 99.9% ใช่ไหมครับ/ค่ะ แต่เราไม่ประเมินค่า 100% เพราะโลกนี้ประกอบด้วยปัจจัยไม่แน่นอน
เช่น ในชั่วขณะถัดจากจุดจุดไฟไป โลกอาจกลายเป็นสูญญากาศในเสี้ยววินาที ดังนั้น 100% ว่ากระดาษจะลุกเป็นไฟจึงไม่แน่นอน
ใช่แล้ว ดังนั้นเรื่องอนาคตก็ไม่มีใครรู้แน่นอน
แต่กลับมาพูดถึงความน่าจะเป็น หากความน่าจะเป็นสูงมาก จะทำนายเหตุการณ์ในอนาคตได้ง่ายขึ้น
ที่จริงแล้วเรื่องนี้ “มนุษย์กับ AI เหมือนกัน” แต่ที่ทราบกันดีคือ ความต่างระหว่างมนุษย์กับ AI คือ ไม่มีอคติด้านจิตใจในการทำนายเลย
แล้ว AI จะทำนายอนาคตอย่างไรล่ะ
ขอให้รอสักครู่ นี่คือประเด็นหลัก
โมเดลการเรียนรู้ของเครื่องที่ AI ใช้เพื่อทำนายอนาคตเรียกว่า “LSTM”
ก่อนอื่น LSTM (Long Short-Term Memory) เป็น
เครือข่ายประสาทเทียมชนิดพิเศษที่ออกแบบมาเพื่อจัดการข้อมูลตามลำดับเวลานั่นเอง
ข้อมูลตามลำดับเวลาก็คือเรียบง่ายๆ ว่า
・กราฟเทคนิคเช่น FX หรือหุ้น
เครือข่ายประสาทเทียมแบบทั่วไป (ชั้นเชื่อมต่อทั้งหมด) จะเข้มแข็งกับ “อินพุตครั้งเดียว” แต่กับข้อมูลที่มี “ลำดับเวลา” เช่นด้านล่าง จุดนี้อ่อนแอ
- ค่าแลกเปลี่ยเงิน (เช่น XAUUSD)
- ราคาหุ้น
- เสียง
- ข้อความ (ประโยค)
- เซนเซอร์ตามลำดับเวลา
ดังนั้น สิ่งที่มีประโยชน์จริงๆ คือRNN (เครือข่ายประสาทเทียมแบบวนซ้ำ)
RNN วนซ้ำ
RNN จะถ่ายทอด “ข้อมูลในอดีต” ไปคำนวณ
x(t-2) → h(t-2)
↓
x(t-1) → h(t-1)
↓
x(t) → h(t)
กล่าวได้ว่าใช้สมการคำนวณแบบนี้
อธิบายง่ายๆ ก็คือ “กลับสู่สถานะเดิมและเก็บความจำไว้ เพราะงั้นจึงแข็งแรงต่อข้อมูลลำดับเวลาเช่น FX”
เครือข่ายประสาทเทียมทั่วไป
อินพุต->เอาต์พุตซ้ำๆ เพื่อฝึก
RNN
อินพุต->ความจำในอดีต->เอาต์พุต
↑ เพราะฉะนั้น RNN จะเรียนรู้รูปแบบกราฟของ FX หรือหุ้นได้ดีในการทำนายกราฟในอนาคต
อย่างไรก็ตาม ปัญหาสำคัญมีอยู่ที่นี่
RNN (เครือข่ายประสาทเทียมแบบวนซ้ำ)
การหายไปของความชัน (Vanishing Gradient)
เมื่อเวลายาวนานขึ้น…
ข้อมูลในอดีตค่อยๆ หายไปจนหมด ซึ่งเป็นปัญหาที่ร้ายแรง
นั่นหมายถึง หากฝึกดูกราฟแท่งเทียน 100 แท่ง ข้อมูลที่ได้จะหายไปหมด
ราวกับว่าแมวที่เดินไปทุกทางจะลืมทุกอย่างภายในสามก้าว
นี่จะไม่เป็นประโยชน์อะไรเลย
ดังนั้น ปัญหานี้จึงถูกแก้ด้วย “LSTM” ที่กล่าวไว้ข้างต้น
อธิบายง่ายๆ ความแตกต่างระหว่าง RNN กับ LSTM คือ “อะไรจะลืมอะไรและอะไรจะจำ” ซึ่งทำให้เป็นไปได้
หมายความว่า ตอนนี้สมองของมนุษย์มีลักษณะใกล้เคียงมากขึ้น
อันนี้เป็นเรื่องเล่าเสริมว่า
ในสาขาเวชศาสตร์สมอง ความทรงจำของมนุษย์จริงๆ แล้วจำทุกสิ่งที่เคยจำมา การลืมและการไม่สามารถรำลึกได้เป็นเหมือนตู้ซึ่งถูกติดขัดและไม่สามารถดึงออกมาได้ ซึ่งดูเหมือนว่าเป็นสาเหตุของการไม่สามารถเรียกความทรงจำออกมาได้
กลับมาที่ประเด็น AI ที่ยังไม่ใกล้ชิดมนุษย์มากนัก มันจะเรียนรู้ด้วยการคัดเลือกและเรียนรู้ไปทีละขั้น
นั่นหมายความว่า LSTM เป็นเทคโนโลยีขั้นสูงสุดในปัจจุบันของเครือข่ายประสาทเทียม การเรียนรู้ด้วยเครื่อง และ AI
แล้วสิ่งนี้จะนำไปใช้ในการเทรดอย่างไร
① เรียนรู้ความต่อเนื่องของรูปแบบ
② ทำให้ความรู้สึกของมนุษย์ถูกแปลงเป็นตัวเลขและประเมินเพื่อคาดการณ์อนาคตได้
ทั้งสองข้อนี้น่าจะเป็นสิ่งที่สำคัญ
มีเพื่อนที่ทำการเทรดเป็นอาชีพมากว่าสิบปี บอกว่า “คำตอบสุดท้ายของการเทรดคือ ทุกอย่างในที่สุดคือพฤติกรรมของราคาที่บอกเราได้ว่าจะเดินไปทางไหนต่อไป” และเขาพูดเช่นนั้นเขาเผชิญหน้ากับกราฟมานับแสนชั่วโมง และการเรียนรู้ช่วงเวลายาวๆ นั้นเป็นสิ่งที่ LSTM หรือการเรียนรู้ด้วยเครื่องสามารถสอนได้ในพริบตายุคดีๆ นี้มีคุณค่าใช้งานจริงนะต่อไปในครั้งถัดไป เราจะอธิบาย TesolFlow ซึ่งเป็นกุญแจสำคัญของ LSTMแล้วพบกันใหม่ในครั้งหน้า
เขาเผชิญหน้ากับกราฟมานับแสนชั่วโมง และการเรียนรู้ช่วงเวลายาวๆ นั้นเป็นสิ่งที่ LSTM หรือการเรียนรู้ด้วยเครื่องสามารถสอนได้ในพริบตา
ยุคดีๆ นี้มีคุณค่าใช้งานจริงนะ
ต่อไปในครั้งถัดไป เราจะอธิบาย TesolFlow ซึ่งเป็นกุญแจสำคัญของ LSTM
แล้วพบกันใหม่ในครั้งหน้า