มาตรการและปริมาณของข้อมูล

เป็นครั้งแรกที่มีการเสนอคำว่า "ข้อมูล"นักปรัชญาโบราณและฟังดูเหมือนข้อมูล - คำอธิบายการนำเสนอการรับรู้ อย่างไรก็ตาม ยังมีการถกเถียงกันในวงการวิชาการเกี่ยวกับคำจำกัดความที่ถูกต้องและสมบูรณ์ที่สุดของคำนี้ ตัวอย่างเช่น นักวิทยาศาสตร์ Claude Shannon ผู้วางรากฐานของทฤษฎีสารสนเทศ เชื่อว่าข้อมูลคือความไม่แน่นอนของความรู้ของอาสาสมัครเกี่ยวกับบางสิ่งบางอย่าง คำจำกัดความที่ง่ายที่สุดของ "ข้อมูล" ฟังเช่นนี้ - เป็นระดับการรับรู้ของวัตถุ

เพื่อกำหนดปริมาณข้อมูลคุณควรทำความคุ้นเคยกับการจัดประเภทของมาตรการข้อมูลสารสนเทศ ข้อมูลทั้งหมดมีสามการวัด: วากยสัมพันธ์ ความหมาย และเชิงปฏิบัติ ลองพิจารณาแต่ละการวัดแยกกัน:

1.การวัดแบบวากยสัมพันธ์ทำงานกับข้อมูลที่ไม่สะท้อนความสัมพันธ์เชิงความหมายกับออบเจกต์ มาตรการนี้ดำเนินการกับประเภทของสื่อ วิธีการนำเสนอและการเข้ารหัส ความเร็วในการส่งและการประมวลผลข้อมูล

ในกรณีนี้ การวัดคือปริมาณข้อมูล -จำนวนหน่วยความจำที่จำเป็นสำหรับการจัดเก็บข้อมูลเกี่ยวกับวัตถุ ปริมาณข้อมูลเท่ากับจำนวนหลักในระบบเลขฐานสอง ซึ่งข้อความที่เป็นปัญหานั้นได้รับการเข้ารหัสและวัดเป็นบิต

เพื่อกำหนดวากยสัมพันธ์ปริมาณข้อมูลให้เราหันไปใช้แนวคิดของเอนโทรปี - การวัดความไม่แน่นอนของสถานะของระบบคือความรู้ของเราเกี่ยวกับสถานะขององค์ประกอบและสถานะของระบบโดยรวม จากนั้นปริมาณของข้อมูลคือการเปลี่ยนแปลงในการวัดความไม่แน่นอนของระบบ นั่นคือ การเปลี่ยนแปลง (เพิ่มขึ้นหรือลดลง) ในเอนโทรปี

2.การวัดเชิงความหมายใช้เพื่อกำหนดเนื้อหาเชิงความหมายของข้อมูลและเชื่อมโยงพารามิเตอร์ที่เกี่ยวข้องของข้อมูลกับความสามารถของผู้ใช้ในการประมวลผลข้อความ แนวคิดนี้เรียกว่าอรรถาภิธานของผู้ใช้ พจนานุกรมเป็นที่เข้าใจกันว่าเป็นชุดของข้อมูลเกี่ยวกับวัตถุที่ระบบหรือผู้ใช้มี จำนวนข้อมูลสูงสุดจากมุมมองของความหมายเป็นไปได้ในกรณีที่ผู้ใช้หรือระบบสามารถเข้าใจจำนวนข้อมูลทั้งหมดได้ - สามารถประมวลผลได้โดยใช้พจนานุกรมที่มีอยู่ - และดังนั้นจึงเป็นแนวคิดที่สัมพันธ์กัน

3.การวัดข้อมูลเชิงปฏิบัติจะวัดมูลค่าของข้อมูลเพื่อให้บรรลุเป้าหมายที่เฉพาะเจาะจง แนวคิดนี้ยังสัมพันธ์กันและมีผลโดยตรงต่อความสามารถของระบบหรือผู้ใช้ในการนำข้อมูลจำนวนหนึ่งไปใช้กับพื้นที่ปัญหาเฉพาะ ดังนั้นจึงแนะนำให้วัดข้อมูลจากมุมมองเชิงปฏิบัติในหน่วยการวัดเดียวกันกับฟังก์ชันวัตถุประสงค์

ลักษณะเชิงคุณภาพของข้อมูลรวมถึงตัวบ่งชี้ต่อไปนี้:

- ความเป็นตัวแทน - การเลือกและการนำเสนอข้อมูลที่ถูกต้องเพื่อการแสดงลักษณะของวัตถุที่เหมาะสมที่สุด

- เนื้อหา - อัตราส่วนของปริมาณข้อมูลในมิติความหมายต่อปริมาณข้อมูลที่ประมวลผล

- ความสมบูรณ์ - การปรากฏตัวในข้อความของชุดข้อมูลขั้นต่ำที่จำเป็นเพื่อให้บรรลุเป้าหมาย

- การเข้าถึง - การดำเนินการตามขั้นตอนในการรับและแปลงข้อมูลโดยผู้ใช้หรือระบบ

- ความเกี่ยวข้อง - ระดับของการรักษาคุณค่าของข้อมูลตั้งแต่ช่วงเวลาที่ได้รับจนถึงช่วงเวลาที่ใช้งาน

- Timeliness - การรับข้อมูลไม่ช้ากว่าเวลาที่กำหนด

- ความแม่นยำ - ระดับที่ข้อมูลที่สอดคล้องกับสถานะที่แท้จริงของวัตถุ

- ความน่าเชื่อถือ - ความสามารถของข้อมูลสารสนเทศเพื่อสะท้อนวัตถุในชีวิตจริงด้วยความแม่นยำที่กำหนด

- ความเสถียร - คุณสมบัติของข้อมูลที่ช่วยให้คุณตอบสนองต่อการเปลี่ยนแปลงในเวลาของข้อมูลดั้งเดิม ในขณะที่ยังคงความถูกต้องตามที่ระบุ

โปรดจำไว้ว่า ข้อมูลมีความสำคัญมากในปัจจุบัน ดังนั้นคุณจำเป็นต้องรู้ให้มากที่สุด!