เชียงรายโฟกัสดอทคอม สังคมออนไลน์ของคนเชียงราย ยินดีต้อนรับคุณ, บุคคลทั่วไป กรุณา เข้าสู่ระบบ หรือ ลงทะเบียน
วันที่ 26 เมษายน 2024, 22:32:11
หน้าแรก ช่วยเหลือ เข้าสู่ระบบ สมัครสมาชิก



  • ข้อมูลหลักเว็บไซต์
  • เชียงรายวันนี้
  • ท่องเที่ยว-โพสรูป
  • ตลาดซื้อขายสินค้า
  • ธุรกิจบริการ
  • บอร์ดกลุ่มชมรม
  • อัพเดทกระทู้ล่าสุด
  • อื่นๆ

ประกาศ !! กรุณาอ่านเพื่อทำความเข้าใจ : https://forums.chiangraifocus.com/index.php?topic=1025412.0

+  เว็บบอร์ด เชียงรายโฟกัสดอทคอม สังคมออนไลน์ของคนเชียงราย
|-+  ศูนย์กลางข้อมูลเชียงราย
| |-+  คุยเรื่องไอที - เทคโนโลยี (ผู้ดูแล: K€nGja1, chiohoh, nuifish, NOtis)
| | |-+  AMD รวม CPU + GPU Fusion เป็น APU ออกขาย 2011
0 สมาชิก และ 1 บุคคลทั่วไป กำลังดูหัวข้อนี้
« หน้าที่แล้ว ต่อไป »
หน้า: [1] พิมพ์
ผู้เขียน AMD รวม CPU + GPU Fusion เป็น APU ออกขาย 2011  (อ่าน 1578 ครั้ง)
kitty9
บุคคลทั่วไป
« เมื่อ: วันที่ 01 ธันวาคม 2010, 14:51:04 »

        



            เป็นที่รู้กันว่าในตอนนี้นั้นทาง AMD กำลังคร่ำเคร่งทำชิพ APU (Accelerared Processing Unit) ของตนอยู่ ซึ่งเป็นชิพที่จะเป็นการรวมกันระหว่างซีพียูและชิพกราฟฟิกไว้ด้วยกัน และเป็นส่วนหนึ่งของเทคโนโลยีฟิวชั่นของทาง AMD เอง โดยชิพ APU ตัวแรกที่มีชื่อรหัสในการพัฒนาว่า Llano นั้นมีแผนที่จะวางตลาดในช่วงไตรมาสแรกของปี 2011 ซึ่งคาดว่าจะเป็นช่วงเวลาใกล้เคียงกับที่ทาง Intel ปล่อย Sandy Bridge ของตนออกมา
 
ชิพ APU Llano นั้นจะเป็นส่วนหนึ่งของแพลตฟอร์ม Sabine ซึ่งจะใช้เทคโนโลยีการผลิต 32 นาโนเมตร โดยที่แกนซีพียูทั้งสี่แกนนั้นจะมีความเร็วมากกว่า 3Ghz ด้วยกัน และจะบริโภคพลังงานเพียง 2.5 - 25W เท่านั้น ส่วนซีพียูที่เป็นแบบสองแกนระดับไฮเอนด์นั้นจะมีค่า TDP โดยรวมระหว่าง 35W - 59W ส่วนรุ่นที่เป็นระดับกลางจะอยู่ที่ 30W นอกจากนั้นชิพ Llano ทุกรุ่นจะมีคุณสมบัติ Turbo Core เช่นเดียวกับที่ Thuban มี ซึ่งเป็นคุณสมบัติที่ตัวซีพียูจะทำการปรับความเร็วสัญญาณนาฬิกาและค่าแรงดันไฟเองโดยอัตโนมัติตามสภาพการใช้งาน สำหรับในส่วนที่เป็นชิพกราฟฟิกนั้นคาดว่าจะเป็นชิพที่มีคุณสมบัติใกล้เคียงกับ Radeon HD 5000 ฉะนั้นแล้วก็เป็นที่แน่นอนว่าชิพ Llano จะรองรับ DirectX 11

ชิพอีกตัวหนึ่งที่เป็นฟิวชั่นเหมือนกันนั้นมีชื่อรหัสในการพัฒนาว่า Ontario ซึ่งจะใช้สถาปัตยกรรม Bobcat ในการผลิต โดยคาดว่าชิพดังกล่าวนั้นจะบริโภคพลังงานเพียง 1W และจะมีประสิทธิภาพโดยรวมประมาณ 90% ของเครื่องที่ผู้ใช้งานทั่วไปใช้กันอยู่ในปัจจุบัน แต่ตัวชิพจะมีขนาดเล็กลงกว่าครึ่งหนึ่ง
 
นาย Dirk Meyer ซีอีโอของ AMD กล่าวในระหว่างการรายงานผลการประกอบการของไตรมาสที่ผ่านมาว่า "Bobcat นั้นจะเป็นสถาปัตยกรรม x86 รุ่นใหม่ โดยที่ Ontario จะเป็นผลิตภัณฑ์ชิ้นแรกที่ใช้สถาปัตยกรรมใหม่นี้ โดยที่จะมีกลุ่มเป้าหมายหลักที่พีซีราคาประหยัดและเน็ตบุ๊ก แต่เทคโนโลยีที่ใช้ใน Bobcat นั้นยังเหมาะสมที่จะนำไปใช้กับผลิตภัณฑ์ที่เน้นการประหยัดพลังงานเป็นสำคัญอีกด้วย เช่นพวก pads เป็นต้น คุณจะได้เห็นผลิตภัณฑ์ประเภทดังกล่าวที่ใช้เทคโนโลยี Bobcat ในปีต่อๆ ไป"
 
นอกจากนั้นในแพลตฟอร์ม Sabine ยังมี Hudson I/O controller ซึ่งจะช่วยให้ระบบดังกล่าวรองรับพอร์ต USB มากสุดถึง 16 ช่อง, USB 3.0, กราฟฟิก PCI Express, พอร์ต SATA 6 ช่อง (พร้อม RAID), 1Gb Ethernet และอื่นๆ ชิพ Llano นั้นมีเป้าหมายที่โน้ตบุ๊ก ทั้งแบบไฮเอ็นด์และแบบประหยัดพลังงาน ในขณะที่ Ontario จะเน้นไปที่กลุ่มสินค้าที่ใช้พลังงานน้อยเช่นแท็บเล็ต และเน็ตบุ๊ก ในขณะนี้ตัวอย่างแรกของชิพทั้งคู่ได้พัฒนาเสร็จเป็นที่เรียบร้อยแล้ว และ Llano กำลังได้รับการจัดส่งไปให้ผู้ผลิตบางเจ้าเป็นที่เรียบร้อย
 
"พวกเราวางแผนที่จะเริ่มเดินสายการผลิตเป็นจำนวนมากภายในช่วงครึ่งหลังของปีนี้ และในตอนนี้เรามีตัวอย่างการออกแบบของชิพฟิวชั่นทั้งคู่ (Llano และ Ontario) แล้ว พวกเรากำลังเรียนรู้เกี่ยวกับมันเป็นอย่างมาก และก็มีความสุขทีเดียวกับสิ่งที่พวกเราได้เห็น และเราได้เริ่มส่งตัวอย่างชิพหนึ่งในนั้นไปให้ลูกค้าที่ได้รับการคัดเลือกบางเจ้าแล้ว" นาย Meyer กล่าว
 

 


ภาพภาพแสดงเส้นทางการบรรจบพบกันระหว่างซีพียูกับจีพียู แต่ภาพนี้เป็นการนำเสนอของเอเอ็มดีเมือไม่นานมานี้เอง เป็นการพูดถึงการรวมกันระหว่างซีพียูกับจีพียูให้เป็นเนื้อเดียวกัน
 สำหรับบทความในคอลัมน์ QuickNOTE ในครั้งนี้เดิมที่ผมตั้งใจจะเขียนเรื่อง “AMD, INTEL, NVIDIA, VIA สงครามซิลิกอน ไม่มี(พันธ)มิตรแท้ และศัตรูที่ถาวร ภาค 2” หลังจากที่ผมเคยเขียนเรื่องนี้ไว้แล้วใน QuickPC ฉบับเดือน กรกฎาคม 2552 แต่พอดีผมไปเจอบทความวิเคราะห์เรื่องหนึ่งที่พูดถึงเส้นทางที่มาบรรจบกันระหว่าง CPU กับ GPU ซึ่งมันก็เป็นเรื่องที่ดูจะเหมาะสมกับช่วงเวลานี้พอดี เพราะเอเอ็มดีก็เพิ่งประกาศถึงรายละเอียดเกี่ยวกับ Fusion ทีเป็นการรวมกันระหว่าง CPU กับ GPU ของตนพอดี ส่วนทางฝั่งอินเทลก็เตรียมที่จะเปิดตัวซีพียูสำหรับโน้ตบุ๊กและเดสก์ท็อปที่มีกราฟิกชิปรวมอยู่ด้วยในตัวในช่วงปลายปีนี้ และจะเริ่มวางจำหน่ายในช่วงต้นปีหน้า อย่างไรก็ตาม GPU ของอินเทลที่รวมเข้าไปในซีพียูนั้นต้องบอกว่าคงจะไม่สามารถเทียบได้กับ GPU ที่รวมเข้าไปในซีพียูของเอเอ็มดี เพราะว่าสถาปัตยกรรม GPU ของอินเทลนั้นไม่ได้ออกแบบมาเพื่อรองรับการประมวลผลแบบขนานเหมือนกับ GPU ของเอเอ็มดีและเอ็นวิเดียครับ เอาเป็นว่าเรื่องนี้ผมจะมาสาธยายให้ฟังกันทีหลัง ตอนนี้เราลองไปอ่านบทความวิเคราะห์เรื่อง “CPU and GPU now, the convergence goes on” จากเว็บไซต์ของนิตยสาร ATOMIC (atomicmpc.com.au) เราไปเริ่มต้นอ่านบทความนี้พร้อมๆ กันเลยครับ
 
ในช่วงระยะเวลาสองปีที่ผ่านมา ความสามารถของซีพียูและจีพียูได้เริ่มมาบรรจบกัน แต่เป็นการบรรจบการด้วยความเชื่องช้าเหมือนการเดินของหอยทาก แม้ว่าในขณะนี้เราจะมีจีพียูที่รองรับโค้ดที่แตกกิ่งก้านสาขาและปฏิบัติการเลขทศนิยม double-precision ตามมาตรฐาน IEEE ได้ แต่ว่าเรายังคงไม่มีจีพียูที่สามารถรันโค้ดภาษาซีหรือฟอร์แทรนจนกว่า Nvidia GT300 จะออกสู่ท้องตลาด และเราก็ยังคงไม่มีจีพียูที่สามารถเข้าถึงหน่วยความจำระบบหรือสนับสนุนโมเดลหน่วยความจำเสมือนเพื่อบูตระบบปฏิบัติการสมัยใหม่ซึ่ง GT300 ก็ไม่สามารถทำเช่นที่ว่าได้
 ในอีกทางหนึ่ง ความพยายามที่จะทำให้ซีพียูสามารถรองรับกราฟิกสามมิติแบบเรียลไทม์ก็ยังอยู่ในสภาพโซซัดโซเซ สรุปแล้วยังไม่มีซีพียูตัวใดที่จะมาแทนที่จีพียู และไม่มีจีพียูตัวใดที่สามารถเข้ามาแทนที่ซีพียู สิ่งที่น่าสนใจคือที่ผ่านมาทั้งสองฝ่ายมีความคืบหน้ามากน้อยเพียงใด และจะเกิดอะไรขึ้นในช่วงหกเดือนนับต่อจากนี้ เราจะใช้ตัววัดที่นิยมใช้กันมากที่สุดของทั้งสองค่ายคือ อัตราการประมวลผลคำสั่งเลขทศนิยม GFLOPS สูงสุดและอัตราการประมวลผลเลขทศนิยม double-precision สูงสุด มาเป็นตัววัดความก้าวหน้ากัน
 ความเร็วของซีพียูเพิ่มขึ้น
 ชิปหกคอร์ Westmere 32 นาโนเมตรของอินเทลเป็นก้าวย่างที่สำคัญต่อไปในโรดแมพของยักษ์ใหญ่ด้านซีพียูของโลก ซีพียู Westmere จะเปิดตัวในแบบ Dual-Processorในชื่อของ Gulftown-EP ที่ใช้กับแพลตฟอร์มเซิร์ฟเวอร์ก่อนในตอนแรก แล้วหลังจากนั้นอีกหนึ่งหรือสองเดือนก็ตามด้วยซีพียูเดี่ยวสำหรับเครื่องเดสก์ท็อป ซึพียู Gulftown มีแคชระดับสามขนาด 12 MB มีตัวควบคุมหน่วยความจำที่ปรับปรุงให้ดีขึ้นซึ่งสามารถสนับสนุนหน่วยความจำ DDR3-1600 MHz หรือแม้แต่หน่วยความจำสำหรับเซิร์ฟเวอร์ (รองรับหน่วยความจำแบบ ECC) ซึ่งทั้งหมดนี้มีช่วงความเร็วสัญญาณนาฬิกาและขนาดไดเหมือนกับชิป Nehalem ปัจจุบัน
 เมื่อซีพียู Gulftown ทำงานในโหมดมาตรฐาน (ไม่ใช่โหมดเทอร์โบ) 3.33 GHz ซีพียู Gulftown หนึ่งตัวจะให้พลังในการประมวลผลเลขทศนิยม double-precision แบบดิบๆ ที่ 80 GFLOPS และเพิ่มขึ้นเป็นสองเท่าคือ 160 GFLOPS เมื่อใช้ซีพียูสองตัว เราคาดว่าจะเห็น Gulftown 3.6 GHz ก่อนกลางปี 2010
 อย่างไรก็ตามตัวเลขที่ Gulftown ทำได้ในขณะนี้มันดูเหมือนว่าเป็นตัวเลขที่ต่ำกว่าตัวเลขสูงสุดของจีพียูในปัจจุบัน แต่เราควรระลึกอยู่ในใจว่ามันเป็นตัวเลขสำหรับปฏิบัติการเลขทศนิยมทั่วไปอย่างสมบูรณ์สำหรับแอพพลิเคชันทุกแบบที่มีอยู่ในปัจจุบันและในอนาคต โดยไม่จำเป็นจะต้องใช้กลเม็ดเด็ดพรายในการเขียนโปรแกรมหรือเขียนโค้ดแบบใหม่ นอกจากนี้ ยังไม่เป็นที่น่าประหลาดใจที่จะเห็น Gulftown เหล่านี้ส่วนใหญ่ทำงานได้เป็นอย่างดีที่ระดับความเร็วมากกว่า 4 GHz ด้วยการโอเวอร์คล๊อกอย่างง่ายเท่านั้น และเมื่อคำนึงถึงพลังในการคำนวณระดับ 200 GFLOPS เมื่อใช้โปรเซสเซอร์สองตัว ประกอบกับหน่วยความจำ ECC สำหรับเครื่องเซิร์ฟเวอร์ DDR3-1600 MHz หรือหน่วยความจำสำหรับเครื่องเดสก์ท็อป DDR3-2000 MHz ทั้งหมดหกช่องทาง จะทำให้ซีพียูเหล่านี้ไม่มีช่วงเวลาในการรอข้อมูลจากหน่วยความจำหลักนานเกินไป
 ในเวลาเดียวกันซีพียู Magny Cours ของเอเอ็มดีที่มีได Istanbul สองตัวในแพคเกจเดียวกันจะมีคอร์สิบสองตัวที่ทำงานได้ช้ากว่า Gulftown โดยอาจมีความเร็วสัญญาณนาฬิกาในตอนเริ่มต้นไม่เกิน 2.4 GHz ไดสองตัวที่อยู่ด้วยกันนี้มีแคชระดับสามโดยรวมเท่ากับ Gulftown เดี่ยวของอินเทล แต่มันสามารถให้พลังในการประมวลผลเลขทศนิยม double-precision สูงสุดในทางทฤษฎีโดยรวมมากกว่า 110 GFLOPS หรือประมาณ 55 GFLOPS ต่อได เราหวังว่า เอเอ็มดีจะสามารถเร่งความเร็วของได Istanbul เดี่ยวได้สูงกว่า 3 GHz ในช่วงเวลาเดียวกันโดยเฉพาะรุ่นที่ใช้สำหรับเครื่องเดสก์ท็อป
 ความก้าวหน้าของพลังในการประมวลผลเลขทศนิยมที่แท้จริงของซีพียูทั้งของอินเทลและเอเอ็มดีควรจะแสดงออกมาให้เห็นในคอร์รุ่นยุคถัดไปในช่วงปลายปี 2010 ซึ่งก็คือ Sandy Bridge ของอินเทล (ซึ่งมีจีพียูรวมอยู่บนได) และ Bulldozer ของเอเอ็มดี ซีพียูทั้งสองตัวควรสามารถเพิ่มสมรรถภาพในการประมวลผลเลขทศนิยม double-precision สูงสุดต่อความเร็วสัญญาณนาฬิกาได้เป็นสองเท่า อันทำให้เราได้ตัวเลขสูงสุดประมาณ 200 GFLOPS เมื่อใช้ชิปสองตัวที่มี 12 คอร์ ความเร็ว 4 GHz
 ความก้าวหน้าของจีพียู
 ในอีกทางหนึ่ง ลำดับความสำคัญของจีพียูมีความแตกต่างไปเล็กน้อย การเพิ่มจำนวนเธรดและจำนวนหน่วยประมวลผลแบบทวีคูณเป็นเรื่องที่มีความสำคัญมากกว่าสมรรถภาพของหน่วยประมวลผลแต่ละตัวภายในจีพียู เนื่องจากไปป์ไลน์กราฟิกทั่วไปมีลักษณะที่คาดการณ์ได้ง่ายกว่าและทำงานแบบขนานได้ดีกว่าเมื่อเทียบกับงานส่วนใหญ่ที่ทำงานบนซีพียูสำหรับการใช้งานทั่วไป ดังนั้น หากจีพียู ATI HD5870 ของเอเอ็มดีมีเฉดเดอร์อย่างง่าย 1,600 ตัวทำงานขนานกัน หรือ GT300 ของ Nvidia มีคอร์เฉดเดอร์ที่มีความซับซ้อนมากกว่าและเหมือนกับซีพียูมากกว่าทั้งหมด 512 ตัว จีพียูจะดูแตกต่างจากคอร์ซีพียู 4 หรือ 8 ตัวบนโปรเซสเซอร์ได
 สรุปแล้ว แม้ว่าเฉดเดอร์จะมีความเร็วสัญญาณนาฬิกาของคอร์น้อยกว่าซีพียูมาตรฐานสามหรือสี่เท่า แต่ว่าความสามารถในการทำงานหรือการประมวลผลแบบขนานอันมโหฬารของจีพียูก่อให้เกิดพลังในการประมวลผลทางทฤษฎีสูงกว่ามาก เมื่อคำนึงถึงสมรรถภาพด้านการคำนวณเลขทศนิยม double-precision ดังที่เราได้กล่าวมาแล้ว เรามาดูกันว่าสิ่งที่เอเอ็มดีหรือ ATI และ Nvidia จะมีอะไรให้เราเห็นในช่วงหลายเดือนข้างหน้าซึ่งเป็นช่วงระยะเวลาเดียวกับ Gulftown ของอินเทลและ Magny Cours ของเอเอ็มดี
 ในฝั่ง ATI จะมีการเพิ่มความเร็วให้แก่ HD5870 สิ่งที่เรียกว่า HD58X0 ควรเป็นการขัดเกลาและปรับปรุงไดตระกูล R800 ซึ่งเมื่อใช้งานในจีพียูความเร็วปกติ 950 MHz และมีเฉดเดอร์ที่มีความเร็วเพิ่มขึ้นแบบสัมพันธ์กัน จะทำให้อุปกรณ์ตัวใหม่นี้มีสมรรถภาพในการประมวลผลเลขทศนิยม single-precision 3 TFLOPS และสิ่งที่สำคัญยิ่งกว่าคือมีสมรรถภาพในการประมวลผลเลขทศนิยม double-precision 600 GFLOPS โดยทั้งคู่ตรงตามมาตรฐาน IEEE อันที่จริง HD5870 บางตัวที่ผ่านการโอเวอร์คล็อกดังเช่นกราฟิการ์ดบางรุ่นอัสซุสก็สามารถทำงานด้วยความเร็วเช่นที่ว่านี้ได้แล้ว
 ดังนั้น หากโค้ดของเราสามารถทำงานกับไลบรารี Stream ของเอเอ็มดีได้อย่างมีประสิทธิภาพ การ์ด HD58X0 ซึ่งใช้จีพียูคู่ดังที่ได้สันนิษฐานไว้จะให้พลังในการประมวลผลเลขทศนิยม double-precision อยู่ที่ 1.2 TFLOPS และสมรรถภาพในการประมวลผลเลขทศนิยม single-precision อยู่ที่ 6 TFLOPS ในตอนนี้ เราต้องมั่นใจว่ามีหน่วยความจำเพียงพอสำหรับเก็บกลุ่มข้อมูลของเธรดหลายตัวโดยไม่ต้องทำงานบนบัส PCIe เพื่อเดินทางไปยังหน่วยความจำหลักที่ทำงานได้ช้ากว่าอันเป็นการลดสมรรถภาพลง ดังนั้นเราจึงขอแนะนำให้ใช้หน่วยความจำ GDDR5 ขนาด 2 GB ต่อจีพียูหากต้องการใช้จีพียูเพื่อการคำนวณ
 ในช่วงต้นปีหน้า เราหวังว่า GT300 ของ Nvidia จะเปิดตัวสู่ท้องตลาดเพราะหากไม่เป็นเช่นที่ว่านี้ จะก่อให้เกิดปัญหาแก่ Nvidia สมมุติว่า Nvidia สามารถเปิดตัว GT300 ได้ในช่วงเวลาที่ว่า เฉดเดอร์โปรเซสเซอร์ 512 ตัวสามารถให้พลังในการประมวลผลเลขทศนิยม single-precision 512 คูณด้วยตัวคูณต่อความเร็วสัญญาณนาฬิกาหรือสมรรถภาพในการประมวลผลเลขทศนิยม 256 คูณด้วยตัวคูณต่อความเร็วสัญญาณนาฬิกา ดังนั้น หากเฉดเดอร์มีความเร็วสัญญาณนาฬิกา 1.8 GHz จะทำให้เรามีสมรรถภาพในการประมวลผลเลขทศนิยม single-precision 1.8 TFLOPS หรือ 900 GFLOPS เมื่อประมวลผลเลขทศนิยม double-precision ซึ่งดูแล้วไม่ได้ขี้เหร่แต่อย่างใด
 แต่สิ่งที่น่าสนใจมากกว่าคือ GT300 สัญญาว่าจะทำให้มีโค้ดที่สามารถใช้พลังดังกล่าวได้กว้างขวางยิ่งขึ้น เนื่องจากสถาปัตยกรรมโดยรวมของ GT300 มีความใกล้เคียงกับซีพียูมากขึ้น ทำให้โค้ดภาษาซี, C++ และฟอร์แทรนปกติควรสามารถทำงานบน GT300 แต่ใช้หน่วยความจำของจีพียู เมื่อคำนึงถึงหน่วยความจำบนบอร์ดขนาด 6 GB ที่จะออกมาในตอนแรก ตามด้วยขนาด 8 GB ที่จะตามมา ซึ่งตัวหลังมีบัสหน่วยความจำ 512 บิต ทำให้ GT300 ควรจะทำงานได้ค่อนข้างดี
 สิ่งที่ GT300 ขาดหายจากการเป็นซีพียูที่แท้จริงซึ่งสามารถรองรับงานทั่วไป ได้แก่ การบูตเข้าระบบปฏิบัติการ, หน่วยจัดการหน่วยความจำอย่างสมบูรณ์, การแปลหน่วยความจำเสมือนเป็นหน่วยความจำทางกายภาพและชุดคำสั่งซีพียูสำหรับการใช้งานทั่วไป นั่นจึงเป็นเหตุผลที่ว่าทำไมเราจึงพูดอยู่เสมอว่า Nvidia ควรมีซีพียูที่แท้จริง (เหมือนกับที่ Alpha ทำ) ซึ่งให้สมรรถภาพในการประมวลผลสูงกว่า X86 และมีความสามารถในการรันโค้ด X86 ได้อย่างรวดเร็วผ่านทางตัวแปลซึ่งทำงานแบบเรียลไทม์เหมือนกับ FX!32 อันมีชื่อเสียงโดยไม่ต้องจ่ายค่าลิขสิทธิ์ X86
 เราไม่ควรลืมว่า EV9 21564 ซึ่งเป็น Alpha ตัวสุดท้ายมีหน่วยประมวลผลเวคเตอร์กว้าง 8,192 ไบต์ซึ่งสามารถให้พลังในการประมวลผลเลขทศนิยม double-precision มากกว่า 100 GFLOPS เมื่อ 9 ปีก่อน ดังนั้น คงเป็นที่น่าตื่นเต้นอย่างมากเมื่อคิดว่าเราจะสามารถทำได้เท่าใดในปัจจุบัน
 ส่วน Tegra และโปรเซสเซอร์ตระกูล ARM ยังมีความอ่อนแอเกินไปที่จะมายืนอยู่ในแถวหน้าของจีพียูที่มีความเร็วระดับ TFLOPS นอกจากนี้เพื่อให้เกิดการหลอมรวมในการทำงานที่ระดับระบบอย่างเหมาะสม เราต้องมีหน่วยความจำระบบที่กว้างและทำงานได้เร็วมาก อย่างน้อยที่สุดต้องใช้หน่วยความจำหลายกิกะไบต์หลายช่องทางเพื่อป้อนข้อมูลจากฝั่งซีพียู และการเชื่อมต่อแบบ HyperTransport หรือ QPI หรือ Alpha EV หลายชุดที่ทำงานได้อย่างรวดเร็วมากเพื่อเชื่อมจีพียูหลายตัวกับซีพียูหลักให้เข้าถึงหน่วยความจำที่ใช้ร่วมกันระหว่างคลังหน่วยความจำของจีพียูและซีพียูได้อย่างมีประสิทธิภาพ เนื่องจาก Nvidia ไม่มีซีพียูที่รองรับงานทั่วไปที่สามารถทำเช่นที่ว่าได้ Nvidia อาจต้องเจรจาขอซื้อลิขสิทธิ์ QPI จากอินเทลเพื่อเชื่อมจีพียูของตนเข้ากับซีพียู Westmere และซีพียูในอนาคตโดยตรงเพื่อให้เกิดโมเดลในการทำงานร่วมกัน แต่ก่อนที่จะเกิดสิ่งที่ว่านี้ Larrabee จะเข้ามาทำงานนี้แทนหรือไม่เป็นสิ่งที่น่าคิด
 เอเอ็มดีจะกลับมาเป็นผู้นำได้อีกครั้งหรือไม่?
 เป็นที่ชัดเจนว่า PCI Express ทั้ง v2 และ v3 ที่กำลังจะออกมามีเวลาหน่วงและเรื่องยุ่งยากมากเกินไปที่จะนำมาเชื่อมโยงซีพียูและจีพียูให้ทำงานร่วมกันสำหรับงานทั่วไปได้อย่างมีประสิทธิภาพสูงสุด โดยการเข้าถึงหน่วยความจำแบบเป็นหนึ่งเดียวกันมักจะเป็นปัญหาใหญ่
 ในปัจจุบัน เอเอ็มดีเป็นบริษัทที่มีจุดเด่นที่เห็นได้ชัดประการหนึ่ง (แม้ว่าอาจจะเป็นการชั่วคราว)คือ เป็นบริษัทที่มีชิ้นส่วนทุกอย่างอยู่ในมือมาเป็นระยะเวลาหนึ่งแล้ว จะเห็นว่าเอเอ็มดีมีคอร์ซีพียูที่ทำงานได้ค่อนข้างเร็ว (ซึ่งควรจะทำได้เร็วกว่านี้) ใน Istanbul Opterons 6 คอร์และรุ่นสำหรับคอมพิวเตอร์ตั้งโต๊ะที่จะเปิดตัวในอนาคตอันใกล้ ซึ่งได้รับการสนับสนุนจาก HyperTransport 3 ที่มีเวลาหน่วงต่ำและทำงานได้เร็วมาก โดยมีความเร็วสูงสุด 25.6 GBps ต่อลิงค์สำหรับโปรโตคอลในการเชื่อมโยงระหว่างซีพียูกับระบบอินพุตเอาต์พุตเวอร์ชัน 3.1 รวมไปถึงจีพียูที่มีสมรรถภาพชั้นนำในตระกูล ATI Radeon R800 ทั้งคอร์ซีพียูและ HyperTransport มีความมั่นคงและผ่านการพิสูจน์มาเป็นระยะเวลานานแล้วดังเช่นการนำ Opteron และ HyperTransport ไปใช้ในตัวเร่ง FPGA และระบบคลัสเตอร์ซุปเปอร์คอมพิวเตอร์ มาเป็นเวลาหลายปี นอกจากนี้ยังมีการนำสล็อต HTX สำหรับการ์ดอินพุตเอาต์พุตไปใช้กับหน่วยความจำระบบเช่นกัน
 เราได้กล่าวมาแล้วว่า Nvidia ขาดแคลนทั้งส่วนซีพียูและการเชื่อมต่อร่วมกัน หาก Nvidia มีสิทธิบัตร Alpha จะเป็นการแก้ไขปัญหาทั้งสองประการและยังได้กำไรตรงที่ทำให้ก้าวเป็นผู้นำระดับต้น ๆ ในด้านสมรรถภาพซีพียูได้ค่อนข้างเร็ว (สมมุติว่ามีโรงงานผลิตซีพียูที่น่าเชื่อถือ) ซึ่งเมื่อ 8 ปีก่อน IBM Microelectronics และ Global Foundries เคยใช้เทคโนโลยีร่วมกันเพื่อผลิต Alphas รุ่นสุดท้าย และ Nvidia อาจเดินตามรอยนั้นก็ได้
 ในตอนนี้ หากเอเอ็มดีสามารถเปิดตัว HyperTransport สำหรับชิปตระกูล R800 ที่เพิ่มหน่วยจัดการหน่วยความจำหรืออย่างน้อยที่สุดก็เป็นกลไกในการเข้าถึงหน่วยความจำโดยตรงได้อย่างรวดเร็วเพื่อเข้าถึงหน่วยความจำหลักและทรัพยากรซีพียูผ่านทาง HTX โดยตรง และอาจมีการเชื่อมโยง HyperTransport อีกจำนวนหนึ่งเพื่อรองรับจีพียูตัวอื่นในแบบเดียวกัน โดยอาจทำงานบนหน่วยความจำ GDDR5 ที่มีอยู่แล้วเพื่อให้เข้าถึงทรัพยากรที่เหลือของระบบได้อย่างรวดเร็วและลื่นไหล ไม่ใช่จำกัดแค่เพียงหน่วยความจำระบบ ก็จะเป็นโอกาสของเอเอ็มดีอีกครั้ง ซึ่งเอเอ็มดีอาจใช้เทคนิคห่อหุ้มมันในลักษณะโปรเซสเซอร์ร่วมของซีพียูแบบเดียวกับที่เคยทำกับ 80287 และ 80286 เมื่อ 25 ปีก่อน
 ด้วยความยืดหยุ่นในการรองรับงานขนาดต่าง ๆ ของ HTX และจำนวนการเชื่อมโยงที่เพียงพอ ทำให้ซีพียูแต่ละตัวสามารถขับเคลื่อนกลุ่มจีพียู โดยต้องเพิ่มเพียงแค่แบนด์วิดธ์ระบบโดยรวมเท่านั้น เมื่อมีจีพียูตัวใหม่ เราทำเพียงแค่เพิ่มแบนด์วิดธ์ในการเชื่อมต่อร่วมกันโดยรวมและแบนด์วิดธ์หน่วยความจำโดยรวม ซึ่งเมื่อมีการติดขัดระหว่างกันน้อยลง ทำให้ไม่เพียงแต่อัตราเฟรมในการเล่นเกม CrossFire จะปรับตัวเพิ่มขึ้นได้ดีขึ้นเท่านั้น แต่ยังช่วยทั้งแอพพลิเคชัน OpenGL และโค้ดที่ใช้คำนวณเช่นกัน
 แม้ว่าสิ่งที่กล่าวมาจะดูดี แต่หลายคนอาจสงสัยว่าเหตุใดเราจึงเรียกว่าชั่วคราว อันที่จริง อินเทลได้ทำงานอย่างหนักเพื่อใช้พื้นฐานของการเชื่อมต่อระหว่างกัน Alpha EV7 และ Alpha EV8 มาพัฒนาเป็น (QPI) Quick Path Interconnect แม้ว่า QPI จะยังคงโดน HyperTransport ทิ้งห่างในแง่ของระดับความสมบูรณ์และยังไม่มีมาตรฐานสำหรับการขยายการ์ด แต่ต้องอย่าลืมว่า QPI ก็ได้รับการหนุนหลังโดยอินเทลและส่วนแบ่งตลาดที่อินเทลครอบครองอยู่
 ดังนั้น เมื่ออินเทลสามารถพัฒนา Larrabee ได้สำเร็จ และหากความสนใจตั้งแต่แรกเริ่มของ Larrabee ที่เน้นเรื่องการทำงานบนเครื่องเดสก์ท็อปและการทำงานด้านกราฟิกยังคงอยู่ อินเทลคงจะผลักดันให้ Larrabee รุ่นแรกทำงานกับซีพียูของตนผ่านทาง QPI โดยตรง ไม่ใช่ทำงานบน PCI ซึ่งช้ากว่า ที่ยิ่งกว่านั้นคือเนื่องจาก Larrabee มีส่วนหน้าเป็น X86 ISA อยู่แล้ว จึงเป็นเรื่องง่ายที่จะมองว่าเป็นโปรเซสเซอร์ร่วมซึ่งเข้าไปรับภาระโค้ดบางส่วนที่สามารถทำงานบนตัวมันเอง
 เราคิดว่าอินเทลจะเดินไปตามแนวทางที่กล่าวมานี้ในช่วงระยะเวลาหนึ่งปีนับจากนี้ ซึ่งภาพอาจเปลี่ยนไปเมื่อเป็นการจับมือร่วมกันระหว่าง Xeon และ Larrabee ของอินเทลแทน ไม่ว่าอินเทลจะตัดสินใจที่จะใช้การเชื่อมโยง QPI กับ Larrabee ในตอนแรกหรือตอนหลัง มันก็เป็นการตัดสินใจของอินเทลซึ่งไม่ติดปัญหาด้านเทคนิคแต่อย่างใด ดังนั้นก่อนที่เอเอ็มดีจะถูกต้อนเข้ามุมอีกครั้ง เอเอ็มดีควรฉกฉวยโอกาสนี้ในขณะที่ยังทำได้ เพราะเมื่ออินเทลเดินไปถึงตอนนั้น โอกาสจะตกอยู่ในกำมือของอินเทลอย่างแน่นอน
 
เครดิตเวป i3.in.th

 แลบลิ้น แลบลิ้น แลบลิ้น แลบลิ้น แลบลิ้น แลบลิ้น แลบลิ้น แลบลิ้น แลบลิ้น แลบลิ้น แลบลิ้น
« แก้ไขครั้งสุดท้าย: วันที่ 01 ธันวาคม 2010, 14:54:45 โดย Granado » IP : บันทึกการเข้า
ปวดตับ
แฟนพันธ์แท้
*
ออฟไลน์ ออฟไลน์

กระทู้: 8,555


ถ่ายรูปคือความสุข ..


« ตอบ #1 เมื่อ: วันที่ 01 ธันวาคม 2010, 15:33:54 »

ถ้าแรงกว่าน่ะ ... แหล่ม
IP : บันทึกการเข้า

อนิจจาผู้ไม่เคยมีความฝัน ... ไม่มีวันได้เจอสุข
คอมต้นไม้
สมาชิกลงทะเบียน
มัธยม
*
ออฟไลน์ ออฟไลน์

กระทู้: 632


ราคาไม่สำคัญ สำคัญอยู่ที่น้ำใจครับ


« ตอบ #2 เมื่อ: วันที่ 03 ธันวาคม 2010, 09:06:29 »

AMD ตกใจ ตกใจ ตกใจ ตกใจ ตกใจ จุมพิต จุมพิต จุมพิต ยิ้มกว้างๆ ยิ้มกว้างๆ
IP : บันทึกการเข้า

Iro Iro Sabisu  Homeservice  บ้านดู่
รับ เชอวิต ซ่อมแซมและปรับปรุง บ้าน อาคาร สำนักงาน ร้านค้า หอพัก คอนโด  ให้คำปรึกษาและออกแบบฟรี
097-3416-863  ช.นุ
หน้า: [1] พิมพ์ 
« หน้าที่แล้ว ต่อไป »
กระโดดไป:  


เข้าสู่ระบบด้วยชื่อผู้ใช้ รหัสผ่าน และระยะเวลาในเซสชั่น

 
เรื่องที่น่าสนใจ
 

ข้อความที่ท่านได้อ่านบนกระดานข่าวแห่งนี้ เกิดขึ้นจากการเขียนโดยสาธารณชน และตีพิมพ์แบบอัตโนมัติ ผู้ดูแลเว็บไซต์แห่งนี้ไม่จำเป็นต้องเห็นด้วย
และไม่รับผิดชอบต่อข้อความใดๆ ผู้อ่านจึงต้องใช้วิจารณญาณในการกลั่นกรองด้วยตัวเอง และถ้าท่านพบเห็นข้อความใดๆ ที่ขัดต่อกฎหมาย และศีลธรรม พาดพิง ละเมิดสิทธิบุคคอื่น ต้องการแจ้งลบ
กรุณาส่งลิงค์มาที่
เพื่อทีมงานจะได้ดำเนินการลบออกให้ทันที..."

Powered by MySQL Powered by PHP Powered by SMF 1.1.21 | SMF © 2013, Simple Machines
www.chiangraifocus.com

Valid XHTML 1.0! Valid CSS!