ก่อนที่เราจะเริ่มทำการวัดข้อมูลเราจะมาแนะนำนิยามและหาว่าเรากำลังทำอะไรอยู่
คำนิยาม
ข้อมูลคือข้อมูลข้อความข้อมูลในการแสดงออกรูปแบบทั้งหมดโดยไม่คำนึงถึงเนื้อหาของพวกเขา แม้แต่ขยะที่เขียนบนกระดาษแล้วก็ยังถือว่าเป็นข้อมูล อย่างไรก็ตามคำจำกัดความนี้มาจากกฎหมายสหพันธรัฐรัสเซีย
ค่าต่อไปนี้สามารถแตกต่างจากมาตรฐานสากล:
- ความรู้เกี่ยวกับวัตถุข้อเท็จจริงความคิดความหมายความคิดเห็นที่ผู้คนแลกเปลี่ยนในบริบทเฉพาะ
- ความรู้เกี่ยวกับข้อเท็จจริงเหตุการณ์ความหมายสิ่งต่าง ๆ แนวคิดซึ่งในบริบทเฉพาะมีความหมายบางอย่าง
Data เป็นรูปแบบการนำเสนอข้อมูลที่เป็นรูปธรรมแม้ว่าในบางตำราแนวคิดทั้งสองนี้สามารถใช้เป็นคำพ้องความหมาย
วิธีการวัด
แนวคิดของข้อมูลถูกกำหนดในรูปแบบที่แตกต่างกัน มันวัดด้วยวิธีที่แตกต่างกัน วิธีการหลักในการวัดข้อมูลสามารถแยกได้ดังนี้:
- วิธีการตามตัวอักษร
- แนวทางความน่าจะเป็น
- แนวทางที่มีความหมายในการวัดข้อมูล
ทั้งหมดนั้นสอดคล้องกับคำจำกัดความต่างๆและมีผู้เขียนคนละคนซึ่งความคิดเห็นเกี่ยวกับข้อมูลต่างกัน แนวทางความน่าจะเป็นถูกสร้างขึ้นโดย A.N Kolmogorov ไม่คำนึงถึงเรื่องของการถ่ายโอนข้อมูลนั่นคือเขาวัดจำนวนเงินโดยไม่คำนึงถึงความสำคัญสำหรับการส่งและรับเรื่อง วิธีการที่สำคัญในการวัดข้อมูลที่สร้างโดย C. Shannon คำนึงถึงตัวแปรมากกว่าและเป็นการประเมินความสำคัญของข้อมูลนี้สำหรับโฮสต์ แต่ลองดูทุกอย่างตามลำดับ
แนวทางความน่าจะเป็น
ดังกล่าวแล้ววิธีการวัดปริมาณข้อมูลแตกต่างกันอย่างมาก วิธีการนี้พัฒนาโดย Shannon ในปี 1948 มันขึ้นอยู่กับข้อเท็จจริงที่ว่าปริมาณของข้อมูลขึ้นอยู่กับจำนวนของเหตุการณ์และความน่าจะเป็น จำนวนข้อมูลที่ได้รับในวิธีการนี้สามารถคำนวณได้โดยใช้สูตรต่อไปนี้ซึ่งฉันเป็นจำนวนที่ต้องการ N คือจำนวนเหตุการณ์และ pและ ความน่าจะเป็นของแต่ละเหตุการณ์
ตัวอักษร
วิธีการคำนวณแบบพอเพียงอย่างแน่นอนปริมาณข้อมูล มันไม่ได้คำนึงถึงสิ่งที่ถูกเขียนในข้อความและไม่เชื่อมโยงจำนวนเงินที่เขียนด้วยเนื้อหา ในการคำนวณปริมาณข้อมูลที่เราจำเป็นต้องรู้พลังของตัวอักษรและปริมาณของข้อความ ในความเป็นจริงพลังของตัวอักษรไม่ได้ จำกัด อย่างไรก็ตามคอมพิวเตอร์ใช้ตัวอักษรที่เพียงพอซึ่งมีความจุ 256 ตัวอักษร ดังนั้นเราสามารถคำนวณได้ว่าข้อมูลมีตัวอักษรที่พิมพ์บนคอมพิวเตอร์เท่าใด ตั้งแต่ 256 = 28 จากนั้นอักขระหนึ่งตัวคือข้อมูล 8 บิต
1 บิตเป็นจำนวนข้อมูลขั้นต่ำที่แยกไม่ออก จากข้อมูลของแชนนอนนี่เป็นข้อมูลจำนวนหนึ่งที่ลดความไม่แน่นอนของความรู้ลงครึ่งหนึ่ง
8 บิต = 1 ไบต์
1024 ไบต์ = 1 กิโลไบต์
1024 กิโลไบต์ = 1 เมกะไบต์
ความคิด
อย่างที่คุณเห็นวิธีการวัดข้อมูลมีความสำคัญมากต่าง มีวิธีอื่นในการวัดปริมาณของมัน ช่วยให้คุณสามารถประเมินปริมาณไม่เพียง แต่ยังมีคุณภาพ วิธีการที่มีความหมายในการวัดข้อมูลช่วยให้เราคำนึงถึงประโยชน์ของข้อมูล นอกจากนี้วิธีการนี้หมายความว่าปริมาณของข้อมูลที่มีอยู่ในข้อความจะถูกกำหนดโดยจำนวนของความรู้ใหม่ที่บุคคลจะได้รับ
หากแสดงออกในสูตรทางคณิตศาสตร์แล้วจำนวนข้อมูลเท่ากับ 1 บิตควรลดความไม่แน่นอนของความรู้ของมนุษย์ลง 2 เท่า ดังนั้นเราจึงใช้สูตรต่อไปนี้เพื่อกำหนดปริมาณของข้อมูล:
X = บันทึก2H ซึ่ง X คือปริมาณข้อมูลที่ได้รับและ H คือจำนวนผลลัพธ์ที่เป็นไปได้อย่างเท่าเทียมกัน ตัวอย่างเช่นลองแก้ปัญหา
ให้เรามีพีระมิดสามด้านที่มีสี่โดยคู่กรณี เมื่อโยนมันขึ้นมีโอกาสที่มันจะตกหนึ่งในสี่ด้าน ดังนั้น H = 4 (จำนวนผลลัพธ์ที่เป็นไปได้อย่างเท่าเทียมกัน) ตามที่คุณเข้าใจโอกาสที่วัตถุของเราจะตกลงบนใบหน้าใดหน้าหนึ่งและยังคงเป็นเช่นนั้นน้อยกว่าถ้าคุณโยนเหรียญและคาดว่ามันจะยืนอยู่บนขอบ
การตัดสิน X = บันทึก2H = บันทึก24 = 2
อย่างที่คุณเห็นผลลัพธ์คือ 2 แต่รูปนี้คืออะไร ตามที่ได้กล่าวไปแล้วหน่วยการวัดขั้นต่ำที่แยกไม่ได้คือบิต ดังนั้นหลังจากการล่มสลายเราได้รับข้อมูล 2 บิต
วิธีการวัดข้อมูลใช้ลอการิทึมสำหรับการคำนวณ เพื่อให้การกระทำเหล่านี้ง่ายขึ้นคุณสามารถใช้เครื่องคิดเลขหรือตารางลอการิทึมพิเศษ
การปฏิบัติ
ความรู้ที่ได้รับมาบทความนี้โดยเฉพาะข้อมูลเกี่ยวกับวิธีการที่มีความหมายในการวัดข้อมูล? โดยไม่ต้องสงสัยเลยในการสอบวิทยาศาสตร์คอมพิวเตอร์ ปัญหานี้ช่วยให้คุณสามารถนำทางในเทคโนโลยีคอมพิวเตอร์โดยเฉพาะอย่างยิ่งในขนาดของหน่วยความจำภายในและภายนอก ในความเป็นจริงความรู้นี้ไม่มีคุณค่าในทางปฏิบัติยกเว้นในทางวิทยาศาสตร์ นายจ้างจะไม่บังคับให้คุณคำนวณจำนวนข้อมูลในเอกสารที่พิมพ์ออกมาหรือโปรแกรมที่เป็นลายลักษณ์อักษร ยกเว้นในการเขียนโปรแกรมซึ่งคุณจะต้องกำหนดขนาดของหน่วยความจำที่จัดสรรสำหรับตัวแปร