ดาบสองคมของ Big Data : หลุมพรางของข้อมูล
หากภาครัฐไม่เตรียมการแก้ปัญหาจากการใช้ Big Data เสียตั้งแต่ต้นมือแล้ว Big Data คือ ดาบสองคมที่จะสร้างปัญหาให้กับคนไทยและในที่สุดจะเป็นภาระกับภาครัฐเอง รวมทั้งจะยิ่งเพิ่มช่องว่างระหว่างความไม่เท่าเทียมซึ่งประเทศไทยถูกติดธงแดงแล้วว่าสูงเป็นอันดับสามของโลกให้มากขึ้นไปอีกจนยากที่จะแก้ไข
นับตั้งแต่รัฐบาลคุณประยุทธ์เข้ามาบริหารประเทศ นโยบายหนึ่งที่รัฐบาลเน้นเป็นพิเศษคือจะนำพาประเทศไปสู่สังคมแห่งนวัตกรรมและเทคโนโลยี โดยชูนโยบาย ประเทศไทย 4.0 รวมทั้งจะใช้ประโยชน์จากเทคโนโลยีเพื่อขับเคลื่อนประเทศ
ในระยะหลังคนในรัฐบาลรวมทั้งคุณประยุทธ์เองพูดถึงเรื่องของ Big Data รวมไปถึงปัญญาประดิษฐ์อยู่บ่อยครั้ง โดยคาดหวังว่าเทคโนโลยีประเภทข้อมูลจะมีส่วนทำให้คนไทยกินดีอยู่ดีขึ้นและน่าจะรวมไปถึงการหลุดพ้นจากกับดักรายได้ปานกลางด้วย ซึ่งเราคงต้องดูกันต่อไปว่า คนไทยจะได้อานิสงส์จากนโยบายนี้อย่างเท่าเทียมกันมากน้อยเพียงใด เพราะเท่าที่ผ่านมาดูเหมือนว่าใครต่อใครต่างเล็งผลเลิศจากประโยชน์ของ Big Data โดยมองข้ามด้านมืด ที่จะส่งผลกระทบต่อสังคมอย่างยิ่ง หาก Big Dataถูกนำมาใช้อย่างขาดความระมัดระวัง
การนำ Big data มาใช้งาน รองรับบริการประเภทต่างๆเพื่อคนหมู่มากนั้นเป็นเรื่องที่ไม่ง่ายเหมือนคำพูด เพราะบนคลื่นอันมหึมาของข้อมูลที่เรามองไม่เห็นนั้นมีทั้ง โอกาสและความเสี่ยงสอดแทรกอยู่แทบทุกบิทของข้อมูล หากจะนำ Big Data มาใช้ให้ได้ผลลัพธ์ที่สมบูรณ์และเป็นธรรม จะต้องอาศัยการบริหารจัดการที่ดีเลิศ มียุทธศาสตร์ด้านข้อมูลและกระบวนการที่ชัดเจนสามารถนำไปปฏิบัติได้ รวมทั้งการมองเห็นปัญหาของข้อมูลและองค์ประกอบอื่นๆอย่างรอบด้าน เพราะการคัดเลือกข้อมูลและส่งต่อไปเพื่อวิเคราะห์ด้วย “ อัลกอริทึม” (Algorithm : ลำดับคำสั่งที่บอกให้คอมพิวเตอร์ทำตาม) นั้น ถ้าข้อมูลไม่ถูกต้องไม่ว่าจะเกิดจาก การคัดเลือกข้อมูลผิด การออกแบบอัลกอริทึมที่ไม่สมบูรณ์ ข้อมูลไม่ครบถ้วนหรือการกำกับดูแลที่ไร้ประสิทธิภาพก็ตาม ผลกระทบจะเกิดขึ้นแก่สังคมอย่างใหญ่หลวงและปิดโอกาสที่จะนำศักยภาพของ Big Data มาใช้งานอย่างเต็มที่และทั่วถึง
ประเทศสหรัฐอเมริกาถือว่าเป็นประเทศที่มี การบริหารจัดการ การวิเคราะห์ข้อมูลและการใช้ประโยชน์จากข้อมูลที่ดีที่สุดในโลก เป็นแหล่งรวมบริษัทนายหน้าขายข้อมูลหลายพันแห่ง รวมทั้งสื่อสังคมออนไลน์รายใหญ่ๆของโลกล้วนแต่มีเจ้าของเป็นคนอเมริกันทั้งสิ้น
ในสมัยประธานาธิบดี บารัค โอบามา รัฐบาลอเมริกันมีความเป็นห่วงต่อผลกระทบจากการนำ Big Data มาใช้ในสังคมอย่างมาก เพราะแม้ว่า Big Data จะมีประโยชน์มากมายเพียงใดก็ตาม แต่ขณะเดียวกันการที่รัฐบาลจะสนับสนุนให้นำ Big Data มาใช้งานนั้น รัฐบาลต้องมั่นใจว่า Big Data จะไม่สร้างปัญหากับสังคม โดยเฉพาะอย่างยิ่งผลกระทบที่จะเกิดขึ้นจากการตัดสินใจของระบบอัตโนมัติอาจจะส่งผลให้เกิดความไม่เท่าเทียมและนำไปสู่การเลือกปฏิบัติได้ ซึ่งหมายความว่า คนที่มีฐานะทางสังคม คนที่เข้าถึงเทคโนโลยีและคนรวยอาจได้รับสิทธิ์บางอย่าง ในขณะที่ผู้มีรายได้น้อยหรือคนผิวสีอาจไม่ได้รับสิทธิ์อย่างเดียวกันหรือถูกกีดกันออกไป เพราะการตัดสินใจนั้นอาจเกิดจากการประมวลผลของอัลกอริทึมบนข้อมูลที่มีความไม่เที่ยงตรง ทั้งๆที่จุดมุ่งหมายของการนำข้อมูลมาใช้ในการตัดสินใจนั้น ส่วนหนึ่ง เพื่อตัดปัญหาความลำเอียงที่เกิดจากการตัดสินใจของมนุษย์ แม้กระนั้นก็ยังยากที่จะหลีกเลี่ยงปัญหาความลำเอียงของอัลกอริทึมที่มนุษย์สร้างขึ้นได้ ถ้าไม่มีกระบวนการตรวจสอบและคัดกรองที่เข้มข้นเพียงพอ
คณะทำงานด้าน Big Data และสภาที่ปรึกษาด้านเทคโนโลยีและวิทยาศาสตร์ภายใต้รัฐบาลของประธานาธิบดี บารัค โอบามา ได้สำรวจ เก็บข้อมูล วิเคราะห์และศึกษาถึงโอกาสและผลกระทบจากการใช้ Big Data ทั้งในภาครัฐและภาคเอกชน เมื่อผลการศึกษาสิ้นสุด สำนักทำเนียบประธานาธิบดี ได้เขียนรายงานฉบับหนึ่ง ชื่อว่า “ Big Data : รายงานระบบอัลกอริทึม โอกาสและสิทธิของพลเมือง ” (Big Data : A report on Algorithmic Systems, Opportunity, and Civil Rights) เผยแพร่เมื่อเดือน พฤษภาคม 2016
สาระสำคัญของรายงานเน้นถึงความท้าทายสองเรื่องซึ่งคาดว่าจะส่งผลในทางลบต่อสังคมอเมริกันโดยรวม หากไม่มีการแก้ไขหรือเตรียมการรับมือไว้ล่วงหน้าเมื่อนำ Big Data มาใช้งาน
ความท้าทายที่ 1 คือ ปัญหาของข้อมูลที่จะป้อนให้กับ อัลกอริทึม
เนื่องจากอัลกอริทึมสำหรับ Big Data นั้น เป็นกระบวนการที่มีความซับซ้อนและเป็นกระบวนการที่ต้องการข้อมูลป้อนเข้าไปเพื่อคำนวณหาผลลัพธ์และนำผลลัพธ์นั้นมาสู่การตัดสินใจและปฏิบัติ ปัญหาที่อาจจะเกิดขึ้นจากการป้อนข้อมูลเข้าสู่กลไกของอัลกอริทึมได้แก่
-ข้อมูลที่ถูกเลือกมาใช้เป็นข้อมูลที่ไม่มีคุณภาพหรือมีมาตรฐานต่ำ
-ข้อมูลที่ถูกเลือกเป็นข้อมูลที่ ไม่สมบูรณ์ คลาดเคลื่อนจากความจริง หรือเป็นข้อมูลที่หมดอายุ
-ข้อมูลที่ถูกเลือกเป็นข้อมูลที่ ถูกเลือกด้วยความลำเอียง
-ข้อมูลที่ถูกเลือกเป็น ข้อมูลเก่าที่ถูกนำมาใช้โดยไม่ตั้งใจหรือไม่รอบคอบทำให้เกิดความลำเอียงที่เกิดจากการนำข้อมูลในอดีตที่ไม่สอดคล้องกับโจทย์ปัจจุบันมาใช้งาน
ความท้าทายที่ 2 คือ ปัญหา คุณภาพของอัลกอริทึม
Big Data เป็นข้อมูลที่มีคุณสมบัติสามอย่าง คือ มีปริมาณมาก มีการเปลี่ยนแปลงอยู่ตลอดเวลาและมีความหลากหลาย การที่จะนำ Big Data มาใช้ประโยชน์ ต้องมีการวิเคราะห์ข้อมูลขั้นสูงซึ่งในภาษาของวิทยาศาสตร์ข้อมูลและภาษาธุรกิจมักจะเรียกกระบวนการนี้ว่า อนาไลติกส์ (Analytics) และหนึ่งในเครื่องมือสำคัญในการวิเคราะห์ข้อมูลก็คือ “อัลกอริทึม” (ลำดับคำสั่งที่บอกให้คอมพิวเตอร์ทำตาม) การใช้อัลกอริทึมภายใต้ Big Data หากไม่มีกลไกการตรวจสอบ ความโปร่งใส ความรับผิดชอบและการปฏิบัติด้วยความเป็นธรรมของอัลกอริทึมภายใต้กฎหมายแล้วอาจเกิดปัญหาที่ไม่สามารถหลีกเลี่ยงได้ เป็นต้นว่า
-ทำให้การออกแบบระบบการจับคู่สินค้าหรือบริการไม่มีคุณภาพ
-การจัดเก็บข้อมูลส่วนบุคคลเพื่อการแนะนำสินค้าและบริการอาจจะเอื้อประโยชน์สำหรับคนเฉพาะกลุ่มโดยไม่ได้มีการกระจายไปในวงกว้างทำให้คนบางกลุ่มขาดโอกาสในการเข้าถึงบริการประเภทเดียวกันเมื่อเปรียบเทียบกับคนอีกกลุ่มหนึ่ง
-การออกแบบอัลกอริทึมมักอยู่บนสมมุติฐานที่ว่า หากเหตุการณ์สองเหตุการณ์เกิดขึ้นพร้อมๆกันโดยยังไม่รู้สาเหตุ (Correlation) จะอนุมานว่าเหตุการณ์หนึ่งทำให้เกิดอีกเหตุการณ์หนึ่ง (Causation) ซึ่งจะนำไปสู่การแปลความหมายที่ผิดได้
-การออกแบบอัลกอริทึมใช้ข้อมูลไม่ครบถ้วนหรือขาดข้อมูลที่เป็นตัวแทนจริงของผู้ที่จะใช้บริการซึ่งอาจทำให้เกิดความไม่เท่าเทียมกันระหว่างผู้ใช้บริการบางกลุ่มบางพวก
ในรายงานยังได้ยกตัวอย่าง กรณีศึกษา 4 กรณีที่แสดงให้เห็นทั้งโอกาสและผลเชิงลบจากการใช้ Big Data ซึ่งได้แก่ กรณีการเข้าถึงระบบการได้รับเครดิตเพื่อขอสินเชื่อ กรณีการจ้างงาน กรณีการศึกษาต่อ และกรณีการตัดสินความยุติธรรมทางอาญา
ดังนั้นเมื่อใดก็ตามที่ Big Data เข้ามามีบทบาทต่อคนกลุ่มใหญ่ คนในสังคมอาจเจอประสบการณ์แปลกๆที่คาดไม่ถึง เช่น ครูของโรงเรียนที่ ผู้ปกครอง นักเรียนหรือแม้แต่ฝ่ายบริหารเห็นเป็นเสียงเดียวกันว่าเป็นครูที่ดีที่สุดของโรงเรียนอาจตกงานได้เพราะไม่ผ่านมาตรฐานการประเมิน เนื่องจากคะแนนวิชาการอ่านและคณิตศาสตร์ของนักเรียนต่ำกว่าเกณฑ์ที่อัลกอริทึมพยากรณ์ไว้ (Sarah Wysocki ครูของโรงเรียน McFarland Middle School วอชิงตัน ดีซี สหรัฐอเมริกา คือ หนึ่งในครูจำนวนกว่าสองร้อยคนที่ตกเป็นเหยื่อของอัลกอริทึมจนทำให้เธอต้องออกจากงานเมื่อปี 2011) หรือ ในบางกรณีผู้สมัครงานที่มีคุณสมบัติครบถ้วนอาจถูกคัดชื่อออกตั้งแต่ยกแรกของการรับสมัครเพราะผู้ว่าจ้างไปเชื่อข้อมูลบนอินเทอร์เน็ตว่า ผู้สมัครมีประวัติเคยถูกจับทั้งๆที่ไม่เป็นความจริง เป็นต้น
ปัญหาจากการป้อนข้อมูลและปัญหาของอัลกอริทึมดังกล่าวจึงเป็นความท้าทายต่อการนำ Big Data มาใช้งาน เพราะข้อมูลที่ไม่เที่ยงตรงและความไม่มีประสิทธิภาพของอัลกอริทึมจะให้ผลลัพธ์ที่ ไร้ประสิทธิผล ขาดความเป็นธรรมและไร้ซึ่งจริยธรรมต่อผู้บริโภคและเป็นแค่ภาพลวงตาที่เกิดจากการบิดเบือนของข้อมูล ดังนั้นบริษัทผู้ให้บริการด้านเทคโนโลยีทั้งหลายจึงมักตกเป็นจำเลยของสังคมเสมอเมื่อถูกถามถึงความโปร่งใสและจริยธรรมที่ปฏิบัติต่อผู้บริโภค ในระยะหลังจึงเห็นข่าวว่า Facebook Google และ Microsoft ต่างขานรับต่อประเด็นจริยธรรมและความโปร่งใสโดยพยายามหาวิธีทำให้จริยธรรมเป็นส่วนหนึ่งของอัลกอริทึมด้วย
นอกจากการศึกษาถึงผลกระทบต่างๆแล้ว ในปี 2016 รัฐบาลของประธานาธิบดี บารัคโอบามา ได้ริเริ่มโครงการตรวจสอบอัลกอริทึมของบริษัทเทคโนโลยีต่างๆหลายแห่งอย่างไรก็ตามการตรวจสอบครั้งนั้นเป็นเพียงการเริ่มต้น เพราะวิธีการตรวจสอบอัลกอริทึมยังคงเป็นคำถามที่ต้องการคำอธิบายและต้องการหลักการปฏิบัติว่าจะตรวจสอบอัลกอริทึมอย่างไรจึงจะได้ผลเป็นที่น่าพอใจ
สิ่งสำคัญที่ต้องระมัดระวังเกี่ยวกับนโยบายการนำข้อมูลขนาดใหญ่มาใช้งานก็คือ ความเชื่อเรื่อง “ข้อมูลไม่หลอกลวง” ซึ่งไม่เป็นความจริงเสมอไป จริงอยู่แม้ว่าตัวข้อมูลเองอาจหลอกลวงไม่ได้ แต่ข้อมูลคือสิ่งที่ถูกปรุงแต่งได้ง่ายที่สุดและกระบวนการซึ่งได้มาของข้อมูลนั้นเกี่ยวข้องกับมนุษย์ซึ่งเป็นผู้นำข้อมูลมาใช้ ข้อมูลจึงอาจถูกบิดเบือนให้เกิดผลลัพธ์ไปในทางใดทางหนึ่งได้เสมอไม่ว่าจะด้วยความตั้งใจหรือไม่ตั้งใจก็ตาม เพราะอัลกอริทึมที่ประมวลผลข้อมูลนั้นคือ สมการที่เต็มไปด้วยความจริง ความเท็จ ความเห็น ความชอบ และความไม่ชอบ ที่เกิดจากน้ำมือมนุษย์ทั้งสิ้น
การที่ผู้บริโภค ต้องปฏิบัติตามคำสั่งที่อัลกอริทึมบอกนั้น เปรียบเสมือนผู้บริโภคถูกตัดสินจาก “กล่องดำ” โดยที่ผู้บริโภค ไม่มีทางรู้เลยว่าภายในกล่องดำนั้นประกอบด้วยกลไกใดบ้าง เพราะสิ่งที่อยู่ใน กล่องดำ มักเป็นความลับของผู้พัฒนาอัลกอริทึมที่ไม่ยอมให้ใครเลียนแบบหรือตรวจสอบได้ง่ายๆ ที่สำคัญคือผู้บริโภคและผู้ใช้บริการไม่สามารถต่อรอง โต้แย้ง ขอความเห็นใจ หรือแม้แต่การพิสูจน์ข้อเท็จจริงจากผู้ให้บริการเหล่านั้นได้ เพราะคำตอบประโยคเดียวที่เราจะได้รับจากผู้ให้บริการคือ “ คอมพิวเตอร์บอกมาอย่างนั้น”
ความเป็นห่วงของรัฐบาลอเมริกันต่อผลกระทบจากการใช้ Big Data คงเป็นตัวอย่างสะท้อนให้เห็นว่า ปัจจัยด้านใดน่าจะสร้างผลกระทบต่อการนำข้อมูลมาใช้งานมากที่สุดและหากประเทศไทยจะนำข้อมูล Big Data มาใช้ในวงกว้างไม่ว่าจะเป็นบริการของภาครัฐหรือภาคเอกชนก็ตาม เราจะต้องทำงานหนักกว่ารัฐบาลอเมริกันหลายเท่า เพราะประเทศไทยยังขาดความพร้อมด้าน การบริหารจัดการข้อมูล ความรู้ด้านวิทยาศาสตร์ข้อมูล เครื่องมือ กฎหมาย บุคลากร การกำกับดูแล รวมถึงยังขาดแนวคิดเรื่องการรับมือจากข้อมูลที่ไม่สะท้อนความเป็นจริง เป็นต้น
ผลที่ตามมาจากการขาดการศึกษาถึงผลเสียของ Big Data ก็คือ ปัญหาความไม่เท่าเทียมและการเลือกปฏิบัติ ระหว่างผู้ที่มีข้อมูลและเทคโนโลยีอยู่ในมือกับผู้ที่ขาดแคลนเทคโนโลยีและเข้าไม่ถึงข้อมูล ดังนั้นหากภาครัฐไม่เตรียมการแก้ปัญหาจากการใช้ Big Data เสียตั้งแต่ต้นมือแล้ว Big Data คือ ดาบสองคมที่จะสร้างปัญหาให้กับคนไทยและในที่สุดจะเป็นภาระกับภาครัฐเอง รวมทั้งจะยิ่งเพิ่มช่องว่างระหว่างความไม่เท่าเทียมซึ่งประเทศไทยถูกติดธงแดงแล้วว่าสูงเป็นอันดับสามของโลกให้มากขึ้นไปอีกจนยากที่จะแก้ไข
คนไทยเป็นคนเก่งเรื่องการผสมผสานวัตถุดิบเพื่อปรุงอาหาร เมนูอาหารไทยจึงโด่งดังไปทั่วโลกไม่แพ้อาหารชาติใดๆ แต่การปรุงส่วนผสมของข้อมูลที่หลากหลายและมากมายมหาศาลกว่าสูตรแกงไทยนั้นถือว่าเป็นของใหม่ที่ต้องเรียนรู้ เพื่อให้ได้ผลลัพธ์ออกมาดีที่สุด ซึ่งคงไม่ใช่เป็นเรื่องยากสำหรับคนไทยยุคใหม่ แต่คงต้องการเวลาและสูตรการปรุงที่เหมาะสม ที่สำคัญคือต้องมีกลไกควบคุมการคัดเลือกส่วนผสมที่ถูกต้องจากภาครัฐ เราจึงสามารถปรุงข้อมูลเพื่อให้ผลลัพธ์ที่เสมอภาคและเป็นธรรมแก่คนไทยทุกคนโดยไม่เลือกปฏิบัติได้
อ้างอิง Big Data : A report on Algorithmic Systems, Opportunity, and Civil Rights
ภาพประกอบ https://www.kaspersky.co.uk/blog/scary-big-data/6142/
อ่านประกอบ “Big Data ฉบับชาวบ้าน” https://www.isranews.org/isranews-article/54956-big-data.html