2020 წლის საპარლამენტო არჩევნების პროგნოზის მეთოდოლოგია
საშუალო შეწონილი
ჩვენი მიდგომა ორ ძირითად მეთოდს ეფუძნება. პირველი მათგანი, ე.წ. საშუალო შეწონილი გულისხმობს გამოკითხვების ღიად ხელმისაწვდომი შედეგების გასაშუალოებას. როგორც შეამჩნევდით, მონაცემები ამომწურავი არაა, რაც პირველწყაროს არასრულყოფილებითაა გამოწვეული - იშვიათი გამონაკლისების გარდა, გამოკითხვების ავტორები მეთოდოლოგიას, კითხვების ფორმულირებას და მით უმეტეს - ნედლ მონაცემებს ძალიან იშვიათად ასაჯაროებენ. პროგნოზის საშუალო შეწონილი მეთოდი საკმაოდ მარტივია - აღებულია მხოლოდ ის პასუხები, რომლებმაც რომელიმე კონკრეტული პოლიტიკური პარტია დაასახელეს. მაგალითისთვის, შესაძლოა, გადაუწყვეტელი ამომრჩევლის პროპორცია გამოკითვაში 50% იყოს, თუმცა გამოთვლის დროს, მათ უგულებელვყოფთ იმ დაშვებით, რომ გადაუწყვეტელ ამომრჩეველში ხმები გადაწყვეტილის პროპორციულად იქნება გადანაწილებული. შესაბამისად, პროცენტულ მაჩვენებელს მხოლოდ ჩამოყალიბებული ამომრჩევლებიდან გამოვითვლით. ცხადია, რომ ეს დაშვება ყოველთვის მართებული ვერ იქნება - ამის კარგ მაგალითს 2012 წლის საპარლამენტო არჩევნები წარმოადგენს, როდესაც გადაუწყვეტელი ამომრჩევლის ხმების დიდი ნაწილი ოპოზიციური კოალიციისკენ გადაიხარა.
კიდევ ერთ დამახასიათებელ ნიშანს წარმოადგენს კვლევის სიახლე. შეწონილი საშუალოს გამოთვლისას, უფრო ახალ გამოკითხვებს მეტი წონა ენიჭება, ხოლო უფრო ძველებს - ნაკლები. შეგვიძლია, ჩავთვალოთ, რომ რაც უფრო ახლოსაა კვლევა ხმის მიცემის დღესთან, მით უფრო აკურატულად ასახავს იგი საზოგადოების განწყობას.
გასათვალისწინებელია, რომ გამოკითხვების გასაშუალოებული შედეგები არჩევნების პროგნოზისთვის ფართოდ გამოიყენება. მაგალითად, ავტორიტეტული პორტალი RealClearPolitics ამერიკის შეერთებულ შტატებში ჩატარებული გამოკითხვების შედეგების აგრეგირების მეშვეობით, საპრეზიდენტო არჩევნების და ე.წ. generic ballot-ის პროგნოზებს რეგულარულად აქვეყნებს.
სტატისტიკური მოდელირება
საარჩევნო პროგნოზირების კიდევ ერთ მეთოდს სტატისტიკური მოდელირება წარმოადგენს. ჩვენ ვიყენებთ ე.წ. state space სტატისტიკურ მოდელს, რომელიც ჯიმ სევიჯმა 2016 წლის აშშ-ის საპრეზიდენტო არჩევნებისთვის გამოიყენა. state space მოდელის მთავარ იდეას წარმოადგენს ის, რომ გამოკითხვები მხოლოდ ნაწილობრივ ასახავენ პარტიულ განწყობას, ხოლო რეალური მნიშვნელობა კი ისეთი ცვლადია, რომელიც ე.წ. დაუკვირვებელ მდგომარეობაშია. ერთის მხრივ, ლატენტურ მნიშვნელობის პოვნას ვცდილობთ ე.წ. ხმაურის მეშვეობით ერთი კონკრეტული დროის მონაკვეთში, ამასთან, გვსურს, დროის ჭრილში მოვახდინოთ ამ მნიშვნელობების აგრეგირება. ბუნებით state space მოდელები ბაიესურია, რაც იმას ნიშნავს, რომ გვაქვს ე.წ. აპრიორული ალბათობა, ანუ - საწყისი მდგომარეობა, ხოლო ამ წინასწარი ალბათობების განახლება სხვა მომდევნო დაკვირვებების მეშვეობით ხდება.
ჩვენი პროგნოზები ეფუძნება 2000 სიმულაციას, ხოლო მონაცემების ინტერპრეტირება სწორედ ამ სიმულაციების განაწილების მიხედვით უნდა მოვახდინოთ. მოდელი საშუალებას გვაძლევს, გამოკითხვის მონაცემებზე დაყრდნობით „ჩავატაროთ“ 2000 არჩევნები. იქიდან გამომდინარე, თუ როგორ არის განაწილებული ნედლი მონაცემები, ალგორითმი გამოითვლის პოტენციურ შედეგებს თითოეული სიმულაციისთვის. შემდეგ ეტაპს წარმოადგენს სიმულაციების მონაცემთა განაწილებაზე დაკვირვება - ყველაზე მოსალოდნელ შედეგად ვიღებთ მედიანურ მნიშვნელობას, ხოლო ის, თუ რამდენად ვიწრო ან ფართოა ჰისტოგრამა, საშუალებას გვაძლევს, ვიმსჯელოთ შეფასების სიზუსტეზე.