โดยความหมายเดิม LSTM คืออะไร Chapter 1 คำอธิบาย LSTM อย่างละเอียด (Chapter 1: พื้นฐานและกลไก) - Navi+ - GogoJungle | แพลตฟอร์มระบบซื้อขายอัตโนมัติ・การวิเคราะห์ตลาด・กลยุทธ์การลงทุน ・ ดาวน์โหลด EA ใช้งานฟรี ・ expert advisor・ fx ・bot ・ea ・copy trade・ indicator・ forex・mt4・อินดี้

สวัสดีครับ/ค่ะ เจ้าหน้าที่ลูกค้าของ OQ นะครับ/ค่ะ เนื่องจากนักพัฒนามีการอัปเดตใหญ่ จึงขอมาพร้อมกันนี้ เพื่อฝึกศึกษาเกี่ยวกับ LSTM สักหน่อยนะครับ/ค่ะ

ก่อนที่ทุกท่านจะเข้าสู่หัวข้อเรื่อง LSTM จะพูดถึงการเทรดและทุกคนเคยคิดบ้างไหมว่า “อยากเห็นอนาคตบ้างจัง”

ฉันเองก็เป็นหนึ่งในนั้นจริงๆ

ในด้านสถิติและความน่าจะเป็น ยิ่งความน่าจะเป็นสูงมากเท่าไร โอกาสที่เหตุการณ์ในอนาคตจะถูกต้องย่อมมากขึ้นตามไปด้วย ซึ่งทุกท่านคงทราบดี

ตัวอย่าง เช่น เขียนไฟลงบนกระดาษ จากนั้นคุณคิดว่าอีกไม่กี่นาที กระดาษจะเป็นอย่างไร

ความน่าจะเป็นที่กระดาษจะถูกเผาอยู่ที่ประมาณ 99.9% ใช่ไหมครับ/ค่ะ แต่เราไม่ประเมินค่า 100% เพราะโลกนี้ประกอบด้วยปัจจัยไม่แน่นอน

เช่น ในชั่วขณะถัดจากจุดจุดไฟไป โลกอาจกลายเป็นสูญญากาศในเสี้ยววินาที ดังนั้น 100% ว่ากระดาษจะลุกเป็นไฟจึงไม่แน่นอน

ใช่แล้ว ดังนั้นเรื่องอนาคตก็ไม่มีใครรู้แน่นอน

แต่กลับมาพูดถึงความน่าจะเป็น หากความน่าจะเป็นสูงมาก จะทำนายเหตุการณ์ในอนาคตได้ง่ายขึ้น

ที่จริงแล้วเรื่องนี้ “มนุษย์กับ AI เหมือนกัน” แต่ที่ทราบกันดีคือ ความต่างระหว่างมนุษย์กับ AI คือ ไม่มีอคติด้านจิตใจในการทำนายเลย

แล้ว AI จะทำนายอนาคตอย่างไรล่ะ

ขอให้รอสักครู่ นี่คือประเด็นหลัก

โมเดลการเรียนรู้ของเครื่องที่ AI ใช้เพื่อทำนายอนาคตเรียกว่า “LSTM”

ก่อนอื่น LSTM (Long Short-Term Memory) เป็น
เครือข่ายประสาทเทียมชนิดพิเศษที่ออกแบบมาเพื่อจัดการข้อมูลตามลำดับเวลานั่นเอง

ข้อมูลตามลำดับเวลาก็คือเรียบง่ายๆ ว่า

・กราฟเทคนิคเช่น FX หรือหุ้น

เครือข่ายประสาทเทียมแบบทั่วไป (ชั้นเชื่อมต่อทั้งหมด) จะเข้มแข็งกับ “อินพุตครั้งเดียว” แต่กับข้อมูลที่มี “ลำดับเวลา” เช่นด้านล่าง จุดนี้อ่อนแอ

ค่าแลกเปลี่ยเงิน (เช่น XAUUSD)
ราคาหุ้น
เสียง
ข้อความ (ประโยค)
เซนเซอร์ตามลำดับเวลา

ดังนั้น สิ่งที่มีประโยชน์จริงๆ คือRNN (เครือข่ายประสาทเทียมแบบวนซ้ำ)

RNN วนซ้ำ

RNN จะถ่ายทอด “ข้อมูลในอดีต” ไปคำนวณ

x(t-2) → h(t-2)

↓

x(t-1) → h(t-1)

↓

x(t) → h(t)

กล่าวได้ว่าใช้สมการคำนวณแบบนี้

อธิบายง่ายๆ ก็คือ “กลับสู่สถานะเดิมและเก็บความจำไว้ เพราะงั้นจึงแข็งแรงต่อข้อมูลลำดับเวลาเช่น FX”

เครือข่ายประสาทเทียมทั่วไป

อินพุต->เอาต์พุตซ้ำๆ เพื่อฝึก

RNN

อินพุต->ความจำในอดีต->เอาต์พุต

↑ เพราะฉะนั้น RNN จะเรียนรู้รูปแบบกราฟของ FX หรือหุ้นได้ดีในการทำนายกราฟในอนาคต

อย่างไรก็ตาม ปัญหาสำคัญมีอยู่ที่นี่

RNN (เครือข่ายประสาทเทียมแบบวนซ้ำ)

การหายไปของความชัน (Vanishing Gradient)

เมื่อเวลายาวนานขึ้น…

ข้อมูลในอดีตค่อยๆ หายไปจนหมด ซึ่งเป็นปัญหาที่ร้ายแรง

นั่นหมายถึง หากฝึกดูกราฟแท่งเทียน 100 แท่ง ข้อมูลที่ได้จะหายไปหมด

ราวกับว่าแมวที่เดินไปทุกทางจะลืมทุกอย่างภายในสามก้าว

นี่จะไม่เป็นประโยชน์อะไรเลย

ดังนั้น ปัญหานี้จึงถูกแก้ด้วย “LSTM” ที่กล่าวไว้ข้างต้น

อธิบายง่ายๆ ความแตกต่างระหว่าง RNN กับ LSTM คือ “อะไรจะลืมอะไรและอะไรจะจำ” ซึ่งทำให้เป็นไปได้

หมายความว่า ตอนนี้สมองของมนุษย์มีลักษณะใกล้เคียงมากขึ้น

อันนี้เป็นเรื่องเล่าเสริมว่า

ในสาขาเวชศาสตร์สมอง ความทรงจำของมนุษย์จริงๆ แล้วจำทุกสิ่งที่เคยจำมา การลืมและการไม่สามารถรำลึกได้เป็นเหมือนตู้ซึ่งถูกติดขัดและไม่สามารถดึงออกมาได้ ซึ่งดูเหมือนว่าเป็นสาเหตุของการไม่สามารถเรียกความทรงจำออกมาได้

กลับมาที่ประเด็น AI ที่ยังไม่ใกล้ชิดมนุษย์มากนัก มันจะเรียนรู้ด้วยการคัดเลือกและเรียนรู้ไปทีละขั้น

นั่นหมายความว่า LSTM เป็นเทคโนโลยีขั้นสูงสุดในปัจจุบันของเครือข่ายประสาทเทียม การเรียนรู้ด้วยเครื่อง และ AI

แล้วสิ่งนี้จะนำไปใช้ในการเทรดอย่างไร

① เรียนรู้ความต่อเนื่องของรูปแบบ

② ทำให้ความรู้สึกของมนุษย์ถูกแปลงเป็นตัวเลขและประเมินเพื่อคาดการณ์อนาคตได้

ทั้งสองข้อนี้น่าจะเป็นสิ่งที่สำคัญ

มีเพื่อนที่ทำการเทรดเป็นอาชีพมากว่าสิบปี บอกว่า “คำตอบสุดท้ายของการเทรดคือ ทุกอย่างในที่สุดคือพฤติกรรมของราคาที่บอกเราได้ว่าจะเดินไปทางไหนต่อไป” และเขาพูดเช่นนั้นเขาเผชิญหน้ากับกราฟมานับแสนชั่วโมง และการเรียนรู้ช่วงเวลายาวๆ นั้นเป็นสิ่งที่ LSTM หรือการเรียนรู้ด้วยเครื่องสามารถสอนได้ในพริบตายุคดีๆ นี้มีคุณค่าใช้งานจริงนะต่อไปในครั้งถัดไป เราจะอธิบาย TesolFlow ซึ่งเป็นกุญแจสำคัญของ LSTMแล้วพบกันใหม่ในครั้งหน้า

เขาเผชิญหน้ากับกราฟมานับแสนชั่วโมง และการเรียนรู้ช่วงเวลายาวๆ นั้นเป็นสิ่งที่ LSTM หรือการเรียนรู้ด้วยเครื่องสามารถสอนได้ในพริบตา

ยุคดีๆ นี้มีคุณค่าใช้งานจริงนะ

ต่อไปในครั้งถัดไป เราจะอธิบาย TesolFlow ซึ่งเป็นกุญแจสำคัญของ LSTM

แล้วพบกันใหม่ในครั้งหน้า