/ / แนวทางที่มีความหมายในการวัดข้อมูล: ทุกสิ่งที่คุณจำเป็นต้องรู้

แนวทางที่มีความหมายในการวัดข้อมูล: ทุกสิ่งที่คุณจำเป็นต้องรู้

ก่อนที่เราจะเริ่มทำการวัดข้อมูลเราจะมาแนะนำนิยามและหาว่าเรากำลังทำอะไรอยู่

คำนิยาม

ข้อมูลคือข้อมูลข้อความข้อมูลในการแสดงออกรูปแบบทั้งหมดโดยไม่คำนึงถึงเนื้อหาของพวกเขา แม้แต่ขยะที่เขียนบนกระดาษแล้วก็ยังถือว่าเป็นข้อมูล อย่างไรก็ตามคำจำกัดความนี้มาจากกฎหมายสหพันธรัฐรัสเซีย

วิธีการให้ข้อมูลในการวัดข้อมูล

ค่าต่อไปนี้สามารถแตกต่างจากมาตรฐานสากล:

  • ความรู้เกี่ยวกับวัตถุข้อเท็จจริงความคิดความหมายความคิดเห็นที่ผู้คนแลกเปลี่ยนในบริบทเฉพาะ
  • ความรู้เกี่ยวกับข้อเท็จจริงเหตุการณ์ความหมายสิ่งต่าง ๆ แนวคิดซึ่งในบริบทเฉพาะมีความหมายบางอย่าง

Data เป็นรูปแบบการนำเสนอข้อมูลที่เป็นรูปธรรมแม้ว่าในบางตำราแนวคิดทั้งสองนี้สามารถใช้เป็นคำพ้องความหมาย

วิธีการวัด

แนวคิดของข้อมูลถูกกำหนดในรูปแบบที่แตกต่างกัน มันวัดด้วยวิธีที่แตกต่างกัน วิธีการหลักในการวัดข้อมูลสามารถแยกได้ดังนี้:

  1. วิธีการตามตัวอักษร
  2. แนวทางความน่าจะเป็น
  3. แนวทางที่มีความหมายในการวัดข้อมูล

ทั้งหมดนั้นสอดคล้องกับคำจำกัดความต่างๆและมีผู้เขียนคนละคนซึ่งความคิดเห็นเกี่ยวกับข้อมูลต่างกัน แนวทางความน่าจะเป็นถูกสร้างขึ้นโดย A.N Kolmogorov ไม่คำนึงถึงเรื่องของการถ่ายโอนข้อมูลนั่นคือเขาวัดจำนวนเงินโดยไม่คำนึงถึงความสำคัญสำหรับการส่งและรับเรื่อง วิธีการที่สำคัญในการวัดข้อมูลที่สร้างโดย C. Shannon คำนึงถึงตัวแปรมากกว่าและเป็นการประเมินความสำคัญของข้อมูลนี้สำหรับโฮสต์ แต่ลองดูทุกอย่างตามลำดับ

แนวทางในการวัดข้อมูล

แนวทางความน่าจะเป็น

ดังกล่าวแล้ววิธีการวัดปริมาณข้อมูลแตกต่างกันอย่างมาก วิธีการนี้พัฒนาโดย Shannon ในปี 1948 มันขึ้นอยู่กับข้อเท็จจริงที่ว่าปริมาณของข้อมูลขึ้นอยู่กับจำนวนของเหตุการณ์และความน่าจะเป็น จำนวนข้อมูลที่ได้รับในวิธีการนี้สามารถคำนวณได้โดยใช้สูตรต่อไปนี้ซึ่งฉันเป็นจำนวนที่ต้องการ N คือจำนวนเหตุการณ์และ pและ ความน่าจะเป็นของแต่ละเหตุการณ์

แนวทางในการวัดปริมาณข้อมูล

ตัวอักษร

วิธีการคำนวณแบบพอเพียงอย่างแน่นอนปริมาณข้อมูล มันไม่ได้คำนึงถึงสิ่งที่ถูกเขียนในข้อความและไม่เชื่อมโยงจำนวนเงินที่เขียนด้วยเนื้อหา ในการคำนวณปริมาณข้อมูลที่เราจำเป็นต้องรู้พลังของตัวอักษรและปริมาณของข้อความ ในความเป็นจริงพลังของตัวอักษรไม่ได้ จำกัด อย่างไรก็ตามคอมพิวเตอร์ใช้ตัวอักษรที่เพียงพอซึ่งมีความจุ 256 ตัวอักษร ดังนั้นเราสามารถคำนวณได้ว่าข้อมูลมีตัวอักษรที่พิมพ์บนคอมพิวเตอร์เท่าใด ตั้งแต่ 256 = 28 จากนั้นอักขระหนึ่งตัวคือข้อมูล 8 บิต

1 บิตเป็นจำนวนข้อมูลขั้นต่ำที่แยกไม่ออก จากข้อมูลของแชนนอนนี่เป็นข้อมูลจำนวนหนึ่งที่ลดความไม่แน่นอนของความรู้ลงครึ่งหนึ่ง

8 บิต = 1 ไบต์

1024 ไบต์ = 1 กิโลไบต์

1024 กิโลไบต์ = 1 เมกะไบต์

ความคิด

อย่างที่คุณเห็นวิธีการวัดข้อมูลมีความสำคัญมากต่าง มีวิธีอื่นในการวัดปริมาณของมัน ช่วยให้คุณสามารถประเมินปริมาณไม่เพียง แต่ยังมีคุณภาพ วิธีการที่มีความหมายในการวัดข้อมูลช่วยให้เราคำนึงถึงประโยชน์ของข้อมูล นอกจากนี้วิธีการนี้หมายความว่าปริมาณของข้อมูลที่มีอยู่ในข้อความจะถูกกำหนดโดยจำนวนของความรู้ใหม่ที่บุคคลจะได้รับ

แนวทางในการวัดปริมาณข้อมูล

หากแสดงออกในสูตรทางคณิตศาสตร์แล้วจำนวนข้อมูลเท่ากับ 1 บิตควรลดความไม่แน่นอนของความรู้ของมนุษย์ลง 2 เท่า ดังนั้นเราจึงใช้สูตรต่อไปนี้เพื่อกำหนดปริมาณของข้อมูล:

X = บันทึก2H ซึ่ง X คือปริมาณข้อมูลที่ได้รับและ H คือจำนวนผลลัพธ์ที่เป็นไปได้อย่างเท่าเทียมกัน ตัวอย่างเช่นลองแก้ปัญหา

ให้เรามีพีระมิดสามด้านที่มีสี่โดยคู่กรณี เมื่อโยนมันขึ้นมีโอกาสที่มันจะตกหนึ่งในสี่ด้าน ดังนั้น H = 4 (จำนวนผลลัพธ์ที่เป็นไปได้อย่างเท่าเทียมกัน) ตามที่คุณเข้าใจโอกาสที่วัตถุของเราจะตกลงบนใบหน้าใดหน้าหนึ่งและยังคงเป็นเช่นนั้นน้อยกว่าถ้าคุณโยนเหรียญและคาดว่ามันจะยืนอยู่บนขอบ

การตัดสิน X = บันทึก2H = บันทึก24 = 2

อย่างที่คุณเห็นผลลัพธ์คือ 2 แต่รูปนี้คืออะไร ตามที่ได้กล่าวไปแล้วหน่วยการวัดขั้นต่ำที่แยกไม่ได้คือบิต ดังนั้นหลังจากการล่มสลายเราได้รับข้อมูล 2 บิต

วิธีการพื้นฐานในการวัดข้อมูล

วิธีการวัดข้อมูลใช้ลอการิทึมสำหรับการคำนวณ เพื่อให้การกระทำเหล่านี้ง่ายขึ้นคุณสามารถใช้เครื่องคิดเลขหรือตารางลอการิทึมพิเศษ

การปฏิบัติ

ความรู้ที่ได้รับมาบทความนี้โดยเฉพาะข้อมูลเกี่ยวกับวิธีการที่มีความหมายในการวัดข้อมูล? โดยไม่ต้องสงสัยเลยในการสอบวิทยาศาสตร์คอมพิวเตอร์ ปัญหานี้ช่วยให้คุณสามารถนำทางในเทคโนโลยีคอมพิวเตอร์โดยเฉพาะอย่างยิ่งในขนาดของหน่วยความจำภายในและภายนอก ในความเป็นจริงความรู้นี้ไม่มีคุณค่าในทางปฏิบัติยกเว้นในทางวิทยาศาสตร์ นายจ้างจะไม่บังคับให้คุณคำนวณจำนวนข้อมูลในเอกสารที่พิมพ์ออกมาหรือโปรแกรมที่เป็นลายลักษณ์อักษร ยกเว้นในการเขียนโปรแกรมซึ่งคุณจะต้องกำหนดขนาดของหน่วยความจำที่จัดสรรสำหรับตัวแปร