Skip to main content

მონაცემთა შეკუმშვა

Data Compression

        მონაცემების შეკუმშვა ძალიან აქტიური კვლევის საგანია. ჩვენ ყოველდღიურად ვიყენებთ სხვადასხვა ტიპის არქივატორებს ნებით თუ უნებლიედ. არსებობს მონაცემთა შეკუმშვის სხვადასხვა მეთოდები რომლებიც გვხვდება ფოტო, ვიდეო, აუდიო პლეიერებში, კონვერტერებში და სხვადასხვა ხასიათის პროგრამებში. მონაცემთა შეკუმშვის გარეშე ამხელა მოცულობის ინფორმაციის შენახვა უბრალოდ შეუძლებელი იქნებოდა. მონაცემთა შეკუმშვა ასევე აქტიურად მოითხოვება როდესაც ჩვენ ამ მონაცემებს ვაგზავნით ქსელში. ამ დროს შეკუშვის ხარისხი უკუპროპორციულად მოქმედებს მონაცემთა დაგაცემის დროზე. მონაცემთა შეკუმშვის იდეა მდგომარეობს იმაში რომ მონაცემები ჩავწეროთ უფრო კომპაქტური სახით, რათა მათ დაიკავონ უფრო მცირე ზომის მეხსიერება. არსებობს მონაცემთა შეკუმშვის სხვადასხვა მეთოდები. ისინი იყოფიან ორ ჯგუფად:

  1. შეკუმშვა დანაკარგების გარეშე. (Lossless Compression)
    როდესაც სრულად ხდება საწყისი ინფორმაციის აღდგენა.
  2. შეკუმშვა დანაკარგებით. (Lossy Compression)
    როდესაც  საწყისი ინფორმაციის აღდგენის პროცესში ხდება მონაცემების დამახინჯება.

Comments

  1. ერთი რაღაც მაინტერესებს და თუ შეგიძლია გამცე პასუხი. შემხვედრია ფაილები, რომლებიც დაარქივებული 5-6 MB ყოფილან, ამოარქივების შემდეგ კი 3-4 GB, თუ შეგიძლია ამიხსნა ეს როგორ ხდება ?

    ReplyDelete
  2. რა ტიპის მონაცემები იყო?

    ReplyDelete
  3. მოკლედ მონაცემებს გააჩნია და შემკუმშველს. მაგალითად ჰაფმენის მეთოდს აქვს ზედა ზგვარი შეკუმშვის კოეფიციენტზე, თუ მონაცემებს ვკუმშავთ როგორც ერთ ბაიტიანი სიმბოლოების მიმდევრობას მაშინ მაქსიმუმ 8-ჯერ შეიკუმშოს მონაცემები. ბევრ სხვა კოდირებას მსგავსი შეზღუდვა არ აქვს მაგალითად RLE-ს, LZW-ს. თუ მონაცემები ისედაც შეკუმშულია მაქსიმალურად(სურათების და ვიდეოების უმრავლესობა), მაშინ ვეღარ შეიკუმშება.

    ReplyDelete
  4. Giorgi zazdze. ვთქვათ გვაქვს ასეთი გამოსახულება: ნომერ 1 უჯრაში ინტენსივობა არის 100, ნომერ 2 უჯრაში აგრეთვე 100, ნომერ 3-შიც 100, 4-ში 100, 5-ში, 6-ში,.....25-ში ინტენსივობა არის 150.
    ამ სურათის აღწერისათვის დაგვჭირდება 25 ჩანაწერის გაკეთება.
    მაგრამ თუ ასე ჩავწერთ: 1-დან 4-დე ინტენსივობა არის 100, 5-დან 25-დე ინტენსივობა არის 150, მაშინ სულ ორი ჩანაწერია საკმარისი.

    ReplyDelete
  5. შეკუმშვის იმ მეთოდი რომელიც თქვენ მოიყვანეთ მაგალითად არის გარბენის სიგრძის კოდირება.
    http://koiavablog.blogspot.com/2013/01/blog-post_14.html
    საკმაოდ გამოყენებადია გარკვეული ტიპის მონაცემებისთვის.

    ReplyDelete

Post a Comment

Popular posts from this blog

CPU GPU და ჰიბრიდული რენდერერები

წყარო         დღემდე აქტუალურია თემა CPU რენდერერი ჯობია თუ GPU . იმისათვის რომ ამ კითხვას მეტნაკლებად ამომწურავი პასუხი გავცეთ განვიხილოთ რენდერერის სტრუქტურა და მოცემულ პლათფორმებზე იპმლემენტაციასთან დაკავშირებული პრობლემები. რენდერერი შედგება რამოდენიმე დიდი კომპონენტისგან როგორიცაა ხილვადობის ამოცანა შეფერადება ინტეგრატორები ფუნქციონალი ხილვადობის ამოცანა         ხილვადობის ამოცანა ერთერთი ყველაზე რთულია გამოთვლითი რესურსის კუთხით. გარდა იმისა, რომ სხივის გეომეტრიასთან თანაკვეთის დათვლას საკმაოდ დიდი დრო ჭირდება, ასევე საჭიროა ამაჩქარებელ სტრუქტურების განახლება კადრიდან კადრზე დინამიური სცენებისათვის. კარგი ისაა, რომ რენდერერის ეს ნაწილი საკმაოდ ადვილად ენკაპსულირებადია და შესაბამისად გვხვდება ბიბლიოთეკები მაგალითად embree(intel), fireRays(AMD), OptiX prime(nvidia), ... რომლებიც ამ ამოცანას საკმაოდ ეფექტურად ხსნიან და რენდერერებშიც მეტნაკლებად ადვილად ინტეგრირდებიან.  სხივების მიდევნების პროცესში ძალიან მნიშვნელოვანია მსგავსი გამოთვლების ლოკალიზება და არსებული SIMD

სინათლის ხილული სპექტრი და სხივის თვისებები

Visible Spectrum სურათზე ნაჩვენებია პრიზმაში გამავალი თეთრი სხივის სპექტრულად გაშლის პროცესი.         სინათლე წარმოადგენს ელექტრომაგნიტურ ტალღას, რომელსაც როგორც ყველა ელექტრომაგნიტურ ტალღას გააჩნია რამოდენიმე მნიშვნელოვანი მახასიათებელი. ერთერთი მნიშვნელოვანი მახასიათებელი არის ტალღის სიგრძე, რომელიც განსაზღვრავს სხივის სპექტრულ ფერს. ელექტრომაგნიტური ტალღები ბუნებაში და თანამედროვე სამყაროში მრავლად გვხვდები. სხვადასხვა ტალთის სიგრძის(სიხშირის) ტალღებს იყენებენ როგორც საყოფაცხოვრებო(რადიო, მობილური ტელეფონი) დანიშნულების, ასევე სამედიცინო(რენდგენის სხივები) და სამხედრო(რადარები) მოწყობილობებში. ადამიანის თვალისთვის ხილული სინათლის ელექტრომაგნიტური ტალღების ტალღის სიგრძე იწყება დაახლოებით 400 ნანომეტრიდან და მთავრდება 700 ნანომეტრზე. ამ დიაპაზონს ქვემოთ ექცევა ულტრაიისფერი ტალღები და დიაპაზონს ზემოთ ექცევა ინფრაწითელი, რომელსაც ადამიანის თვალი ვერ აღიქვამს(იხილეთ ქვემოთ მოცემული სურათი). სინათლის თეთრი სხივი შედგება სხვადასხვა სიხშირის ტალღების ერთობლიობისგან.        

ფერების RGB მოდელი

RGB Color Model         ფერების RGB მოდელი წარმოადგენს ისეთ მოდელს რომელშიც სამი ძრირითადი ფერის წითელი, მწვანე და ლურჯის საშუალებით მიიღება ფერების ფართო სპექტრი. მისი დასახელებაც მოდის სწორედ ძირითადი ფერების ინგლისური სახელწოდების ინიციალებიდან(Red, Green, Blue).         ფერთა სპექტრის ამდაგვარი წარმოდგენა დაკავშირებულია იმასთან, რომ გამოსახულების გამოტანის მოწყობილობებში რომელიც გააჩნიათ კომპიუტერებს, ტელევიზორებს ფერის მიღება ფიზიკურად ხდება სწორედ ამ სამი ძირითადი ფერის შეზავებით. დღესდღეობით ყველაზე გავრცელებული არის 24 ბიტიანი RGB მოდელი, სადაც თითოეულ კომპონენტს ეთმობა ერთი ბაიტი და შესაბამისად შეუძლია მიიღოს ნებისმიერი მნიშვნელობა [0, 255] დიაპაზონში, რაც საბოლოოდ გვაძლევს 16777216 განსხვავებულ ფერს.