วันอังคารที่ 22 มกราคม พ.ศ. 2556

เทคโนโลยีสารสนเทศสำหรับชีววิทยา



     ชีวสารสนเทศ เป็นศาสตร์การจัดการข้อมูลทางชีววิทยาซึ่งมีอยู่เป็นปริมาณมาก  เพื่อการประยุกต์มีจุดกำเนิดมาจากโครงการThe Human Genome Project ในปี2533 โดยการสนับสนุนของสำนักสุขภาพแห่งชาติและกรมพลังงานแห่งสหรัฐอเมริกา  โครงการนี้เป็นโครงการทางเทคโนโลยีทางชีวภาพที่สร้างความเปลี่ยนแปลงครั้งสำคัญอันหนึ่งของมนุษยชาติ มีการร่วมมือในระดับนานาชาติเพื่อศึกษาวิเคราะห์ลำดับนิวคลีโอไทด์ในจีโนมมนุษย์





และต่อมาได้เกิดโครงการศึกษาจีโนมในสิ่งมีชีวิตอื่นอีกหลายชนิด เช่น จีโนมข้าว จีโนมหนูจีโนมยีสต์เป็นต้น ทั้งหมดนี้ก่อให้เกิดการพัฒนาเทคโนโลยีรวมถึงวิทยาการคอมพิวเตอร์ควบคู่กันจนเป็นที่มาของศาสตร์ชีวสารสนเทศ โดยอาศัยการนำผลการทดลองจากการวิจัยในห้องปฏิบัติการ (in vitro informations) บันทึกลงในฐานข้อมูลที่แยกประเภทชัดเจน และเมื่อต้องการออกแบบการทดลองใหม่หรือตั้งสมมติฐานใหม่ก็นำข้อมูลชมภูนุช  วิรุณานนท์และ วรวุฒิ จุฬาลักษณานุกูล / วารสารวิทยาศาสตร์บูรพา. 15 (2553) 2 : 99-106101ดังกล่าวกลับมาช่วยวิเคราะห์ทำนายสมมติฐานหรือสร้างต้นแบบการทดลองใหม่ด้วยโปรแกรมคอมพิวเตอร์(in silico modeling)ล่วงหน้าก่อนการลงมือทำปฏิบัติการจริงได้ นับเป็นว่าเป็นพัฒนาการที่สำคัญยิ่ง ช่วยในการทำงานบางประเภทของนักวิทยาศาสตร์ที่ในอดีตอาจเป็นไปไม่ได้เลย ตลอดจนลดค่าใช้จ่ายและเวลาในการทำงาน ปัจจุบันมีฐานข้อมูลทางชีววิทยาให้เลือกใช้หลากหลายตามการใช้งาน ตัวอย่างเช่น ข้อมูลของ
ลำดับนิวคลีโอไทด์ในจีโนมของจุลชีพ ข้อมูลลำดับกรดอะมิโนของเอนไซม์เซลลูเลสในรา ข้อมูลวิถีเมแทบอลิซึมของน้ำตาลเพนโทสในแบคทีเรีย เป็นต้น ซึ่งถ้าจะแบ่งออกเป็นหมวดหมู่ก็อาจจำแนก
เพื่อให้เห็นขอบเขตกว้างๆ ดังนี้คือ
1. ฐานข้อมูลที่เกี่ยวข้องกับการศึกษาจีโนม ข้อมูลโครงสร้างและหน้าที่ของยีน
2. ฐานข้อมูลที่เกี่ยวข้องกับการศึกษาทรานสคริปโตมข้อมูลการแปลรหัสของยีน
3. ฐานข้อมูลที่เกี่ยวข้องกับการศึกษาโปรตีโอม หรือข้อมูลจากการศึกษาโปรตีนที่อยู่ในสิ่งมีชีวิต
4. ฐานข้อมูลที่เกี่ยวข้องกับการศึกษาเมตาโบโลมวิถีเมแทบอลิซึม


สำหรับนักชีววิทยาแล้ว การเลือกค้นข้อมูลจากฐานข้อมูลที่มีความเฉพาะเจาะจงกับงาน ถือเป็นเรื่องที่สำคัญยิ่งและไม่ควรละเลย เพราะจะเพิ่มโอกาสได้ข้อมูลที่สามารถ
ตอบสนองความต้องการของผู้ใช้ได้ตรงตามวัตถุประสงค์การใช้งานได้ดีขึ้น หรืออาจเรียกว่ามีความเฉพาะเจาะจงมากขึ้นเนื่องจากฐานข้อมูลเหล่านี้ได้มีการคัดกรองข้อมูลแล้วในระดับหนึ่ง
เช่น เมื่อมีความต้องการค้นข้อมูลลำดับของกรดอะมิโน (aminoacid) ก็ควรใช้ข้อมูลในฐานข้อมูล SWISSPROT หรือ ExPASyจะเหมาะสมกว่า หรือหากจะสืบค้นหาลำดับเบสที่เกี่ยวข้องกับโรค
Haemophilia B ก็ควรจะใช้ฐานข้อมูล HAEMB จะเข้าถึงข้อมูลได้รวดเร็วกว่าใช้Google ตามปกติตารางที่ 1 แสดงตัวอย่างฐานข้อมูลที่เฉพาะเจาะจงกับงานเฉพาะทางทางอณูชีววิทยา
และพันธุศาสตร์

โดยทั่วไปฐานข้อมูลจะมีการติดต่อกับผู้รับบริการในการรับข้อมูล ให้บริการข้อมูล และวิเคราะห์ข้อมูลที่ได้รับเทียบกับฐานข้อมูลโดยมีบริการหลายอย่างเช่น ในฐานข้อมูล The National Center for Biotechnology Information (NCBI) มีบริการPubMed ซึ่งบริการ Basic Local Alignment Search Tool
(BLAST) แก่ผู้ใช้โดยให้ผู้รับบริการกรอกข้อมูลผลการอ่านลำดับเบสของสารพันธุกรรมของงานวิจัยตนเองลงไปเพื่อทำการเทียบลำดับความเหมือน ระหว่างข้อมูลของผู้รับบริการและข้อมูลลำดับ
สารพันธุกรรมที่จัดเก็บในฐานข้อมูล เพื่อช่วยในการตัดสินหรือวิเคราะห์ผลของผู้รับบริการ ปัจจุบันมีเว็บไซต์เป็นจำนวนมากที่เกี่ยวข้องกับทางชีวสารสนเทศ ซึ่งมีจำนวนมากที่ให้บริการข้อมูล
โดยไม่คิดค่าใช้จ่าย (ตารางที่ 2)

บทความนี้จะกล่าวถึงตัวอย่างการประยุกต์ใช้ใน 3ลักษณะคือ วิเคราะห์ข้อมูลทางพันธุกรรมเพื่อการศึกษาทางวิทยาศาสตร์บริสุทธิ์ (pure science) การออกแบบยา และวิศวกรรมเมแทบอลิกการวิเคราะห์ข้อมูลทางพันธุกรรม

การจัดเรียงลำดับนิวคลีโอไทด์หรือกรดอะมิโนจากสายโพลีเปปไทด์หลายๆ สายของทั้งหมดหรือส่วนหนึ่งของสายโพลีเปปไทด์ (alignment) เป็นข้อมูลพื้นฐานในการทำนายโครงสร้างโปรตีน บริเวณที่จัดเรียงกันกันได้ดีที่สุดในโครงสร้างจะมีการแสดงผลออกมาโดยการทำงานของโปรแกรมซึ่งกำหนดค่าโดยผู้ใช้ การจัดเรียงที่ดีที่สุดนั้นมักเป็นการพยายามที่จะทำให้ทั้งจำนวนของช่องว่างและลำดับกรดอะมิโนหรือดีเอ็นเอที่เข้าคู่ผิด(mismatch) มีค่าน้อยที่สุด (เจษฎา เด่นดวงบริพันธ์,2545)

การวิเคราะห์ข้อมูลทางพันธุกรรมจากการจัดเรียงลำดับนิวคลีโอไทด์ เป็นประโยชน์ต่อการทำงานทางชีวโมเลกุลมากทางด้านการวิเคราะห์หายีน โครงสร้างของยีน เช่น ส่วนที่ทำหน้าที่
ควบคุมการทำงานของยีน (regulatory elements) ส่วนที่จะทำการแปลรหัสเพื่อให้ได้โปรตีน (coding sequence) ซึ่งสามารถประยุกต์ใช้ได้ในกระบวนการโคลนเพื่อการสร้างโปรตีนลูกผสม
ใหม่ๆ ขึ้น หรือแม้กระทั่งการจัดจำแนกและชี้เฉพาะสปีชีส์ของสิ่งมีชีวิตโดยเทียบความคล้ายคลึงจากลำดับเบส และสร้างแผนภาพต้นไม้แสดงความสัมพันธ์ของสิ่งมีชีวิตขึ้นมา เป็นต้น

สำหรับในงานทางด้านโปรตีน มักเป็นการทำงานที่เกี่ยวกับการเปรียบเทียบโครงสร้างสามมิติของโปรตีนวิธีการที่ง่ายที่สุดประกอบด้วย การเทียบบริเวณหนึ่งบริเวณ
หรือมากกว่าของโปรตีนเดียวกันแต่มาจากแหล่งที่มาที่ต่างกัน
สามารถให้ข้อมูลที่เป็นประโยชน์ได้เช่น
1. ความเหมือนหรือความต่างระหว่างการทำนายโครงสร้างผลึก (crystal structure) ของสองลำดับกรดอะมิโนที่อิสระต่อกัน
2. ความเหมือนหรือความต่างระหว่างภายในกลุ่มของโครงสร้างหนึ่งๆ ซึ่งมักจะได้มาด้วยการวิเคราะห์ NMR spectroscopy
C

แหล่งอ้างอิง

ไม่มีความคิดเห็น:

แสดงความคิดเห็น