ტექნოლოგია ბიზნესი

“ML მოდელების ქცევის ახსნის მეთოდები“ - TIDA-ს მაისის სესიის სპიკერი მონაცემთა მეცნიერი ვიოლეტა მიშევა იქნება

უკვე მეორე წელია, საქართველოში ბიზნესმონაცემთა და ანალიტიკის კონფერენცია TIDA ტარდება. TIDA, ანუ Tbilisi International Data Analytics 2020 წელს დაარსდა და მას ერთი მთავარი მიზანი აქვს: შეიქმნას საქართველოში დაფუძნებული და მსოფლიო დონის საერთაშორისო მონაცემთა ანალიტიკის კომუნა.

მაისი 11, 2021

არაერთი საინტერესო და წარმატებული თემის განხილვის შემდეგ, TIDA-ს შემდეგი ონლაინ სესია 13 მაისს, Zoom-ში ჩატარდება. მონაცემთა ანალიტიკით დაინტერესებულ ადამიანებს განსაკუთრებულად მნიშვნელოვანი სესია ელით, რომელსაც ნიდერლანდური ლიდერი ბანკის ABN Amro-ს მონაცემთა მეცნიერი, ვიოლეტა მიშევა გაუძღვება. სესიის თემა “მანქანური დასწავლის (ML) მოდელების ქცევის ახსნის მეთოდები” იქნება.

 

მოდელების ქცევის ახსნის მეთოდები (იგივე Model Explainability) მანქანური დასწავლის სფეროში შედარებით ახალი მიმართულებაა, რომელიც სწრაფად ვითარდება და იხვეწება. სანამ მასზე განვავრცობდეთ საუბარს, ორიოდე სიტყვით მიმოვიხილოთ, თუ რას ნიშნავს მანქანური დასწავლა და მისი მოდელები. 

მანქანური დასწავლა კომპიუტერული მეცნიერების ქვედისციპლინაა, რომელიც სწავლობს მეთოდებს, თუ როგორ ავაგოთ გადაწყვეტილების მიმღები ავტომატური პროგრამები მონაცემებზე დაყრდნობით. ტრადიციული პროგრამირებისგან განსხვავებით, მანქანური დასწავლის მოდელების პროგრამულ კოდს უშუალოდ სპეციალისტი არ წერს. ნაცვლად ამისა, მანქანური დასწავლის მოდელის კოდი ავტომატურად იწერება წარსულ მონაცემებზე დაყრდნობით ისე, რომ საბოლოო მოდელს პროგნოზირების საუკეთესო უნარი ჰქონდეს.

 

მაგალითად, მანქანური დასწავლის მოდელი, რომელიც წყვეტს, თუ ვის უნდა შევთავაზოთ მოგზაურობისას ბარგის დაზღვევის სერვისის ყიდვა, აგებულია არა ცხადი წესების საშუალებით („თუ კლიენტი ხშირად დადის საზღვარგარეთ, მაშინ შევთავაზოთ“), არამედ არაცხადი და კომპლექსური წესების საფუძველზე, რომლებსაც უშუალოდ მანქანური დასწავლის ალგორითმი აგებს (ადამიანის მინიმალური ჩარევით) წარსულ მონაცემებზე დაყრდნობით ისე, რომ შედეგად რაც შეიძლება სწორ კლიენტებს შევთავაზოთ დაზღვევის შეძენა.

ასეთი მოწყობა საშუალებას იძლევა, მანქანური დასწავლის ალგორთმმა მიაგნოს ისეთ კომპლექსურ წესებს, რომლებიც ადამიანებს შეიძლება გამოგვრჩეს და საბოლოოდ, უკეთესი საპროგნოზო მოდელები მივიღოთ. თუმცა საპირწონედ, ამ ალგორითმების მიერ განვითარებული მოდელები იქცევიან ე. წ. „შავ ყუთებად“, ანუ გადაწყვეტილების მიმღებ სისტემებად, რომლებში ჩახედვაც შეუძლებელია და არც იმის გაგებაა ადვილი, თუ როგორ მიიღეს მათ კონკრეტულ შემთხვევაში გადაწყვეტილება.

 

ეს სანდოობისა და გამჭვირვალობის მნიშვნელოვან პრობლემას წარმოშობს: თუკი დიდად არაფერი დაშავდება, თუ ისეთ კლიენტს შევთავაზებთ ბარგის დაზღვევას, რომელიც დაინტერესებული არაა ან პირიქით - არ შევთავაზებთ მას დაინტერესებულ კლიენტებს, რა მოხდება მაშინ, თუ „შავი ყუთი“ მოდელი არასწორად მიიღებს მნიშვნელოვან გადაწყვეტილებას, ხოლო ჩვენ არ შეგვიძლია ავხსნათ, თუ რატომ მოხდა ეს? მაგალითად, რატომ აღმოჩნდა ბანკის კლიენტი არასწორად ეჭვმიტანილი ფულის გათეთრებაში, ან რატომ მოუხვია თვითმართვადმა მანქანამ არასწორ დროს და შექმნა ავარიული სიტუაცია? ყველაზე მცირე, ჩვენ მივიღებთ კლიენტის ნდობის დაკარგვას, უფრო უარეს შემთხვევაში - ჯარიმებს სახელმწიფო მარეგულირებლისგან, უკიდურეს შემთხვევაში კი ადამიანების ჯანმრთელობა დგება საფრთხის ქვეშ.

 

სწორედ აქ გვეხმარება მანქანური დასწავლის მოდელების ქცევის ახსნის მეთოდები. ეს მეთოდები განვითარდა „შავი ყუთი“ მოდელების განვითარებასთან ერთად და ზუსტად იმ მიზეზით, რომელზეც ზემოთ ვისაუბრეთ: კომპანიებს, სახელმწიფო მარეგულირებელ ორგანოებსა და კლიენტებს სჭირდებათ იცოდნენ, თუ რატომ იღებენ მანქანური დასწავლის მოდელები ამა თუ იმ გადაწყვეტილებას. ეს მეთოდები საშუალებას გვაძლევენ, მოდელის მიერ გადაწყვეტილების პროცესი გამჭვირვალე და შესაბამისად, უფრო სანდო გავხადოთ.

სწორედ ამ თემებზე ისაუბრებს 13 მაისის სპიკერი ვიოლეტა მიშევა. ის ერთ-ერთია იმ ადამიანებს შორის, რომლებიც ამ მიმართულებით მუშაობენ. ვიოლეტა მონაცემთა მეცნიერია, რომელიც ნიდერლანდების წამყვან ბანკში მუშაობს და შესაბამისად, დიდი პასუხისმგებლობა აკისრია. 

“მონაცემთა მეცნიერი არის ადამიანი, რომელსაც აქვს სტატისტიკისა და მათემატიკის სიღრმისეული ცოდნა კომბინირებული პროგრამული ენების ცოდნასთან. მას შეუძლია ისეთი მონაცემების შეგროვება და დამუშავება, რომელიც გამოიყენება კონკრეტული პრობლემის მოგვარებისთვის ხელოვნური ინტელექტისა და მანქანური დასწავლის დახმარებით. ჩვენი მიზანია შევქმნათ ან ვიპოვოთ ისეთი ალგორითმი, რომელიც ყველაზე ეფექტურად იპროგნოზებს ჩვენთვის საინტერესო მოვლენას, რაც ძალიან საინტერესო პროცესია”, - ასე განმარტავს ვიოლეტა მიშევა საკუთარ პროფესიას. 

სწორედ იმის გამო, რომ მონაცემთა დამუშავება და მანქანური სწავლების მოდელების შექმნა-შერჩევის პროცესი დიდ გავლენას ახდენს სხვადასხვა ორგანიზაციის საქმიანობაზე, ისევე როგორც ადამიანების ცხოვრებაზე, მანქანური სწავლების მოდელების ქცევების ახსნის მეთოდების შესწავლა მის დასახვეწად ერთ-ერთი ყველაზე ეფექტური გზაა. TIDA-ს კონფერენციის სესიამდე, ვიოლეტა მიშევასთან ეს საკითხი სიღრმისეულად განვიხილეთ და საინტერესო ინფორმაციაც მივიღეთ.

“დღეს მანქანური სწავლების მოდელების ქცევის ახსნის მეთოდები საიმედო პროგნოზების გაკეთების საშუალებას გვაძლევს, რადგან პროცესი ძალიან სწრაფად მიმდინარეობს. შეგვიძლია ვთქვათ, რომ გვაქვს მნიშვნელოვანი შედეგებიც, თუმცა არ უნდა დაგვავიწყდეს, რომ ეს ყველაფერი მხოლოდ დასაწყისია და კიდევ ბევრი დროა საჭირო მისი სრულყოფისთვის”, - ამბობს ვიოლეტა მიშევა.  

ხელოვნური ინტელექტი დღეს უკვე არაერთ სფეროშია ინტეგრირებული და მისი დახვეწა უწყვეტად მიმდინარეობს. მომავალში მისი გავლენა კაცობრიობაზე კიდევ უფრო გაიზრდება და ისეთ სფეროებშიც აქტიურად გამოჩნდება, როგორიცაა მედიცინა, სახელმწიფო სერვისები, საბანკო და ფინანსური ინსტიტუტები და სხვა.

 

TIDA-ს სპიკერი ფიქრობს, რომ ამ პროცესის დასაჩქარებლად აუცილებელია სწრაფი პროგრესი ჰქონდეს მანქანური დასწავლის მოდელების ქცევის ახსნის მეთოდების შესწავლას. 

“მონაცემთა მეცნიერებს, პროგრამისტებს, ინვესტორებს, მარეგულირებლებს და უბრალოდ მომხმარებლებსაც კი, გაცილებით მკაფიო პასუხები სჭირდებათ მოდელების ფუნქციონირებასთან დაკავშირებით. გადაწყვეტილება, რომელსაც ალგორითმი გვთავაზობს, არ უნდა იყოს გაუმჭვირვალე და მისი გაშიფრვა შესაძლებელი უნდა გახდეს. სწორედ ეს არის დღეს მთავარი გამოწვევა და ამიტომაც არის მნიშვნელოვანი მანქანური დასწავლის ქცევის ახსის მეთოდების განვითარება” - ამბობს ვიოლეტა. 

დღეს სხვადასხვა საერთაშორისო ორგანიზაცია და მთავრობა მკაცრ რეგულაციებს იღებენ იმისთვის, რათა “შავი ყუთი” მოდელის გამოყენებით მნიშვნელოვანი გადაწყვეტილებების მიღება არ მოხდეს ისეთ სფეროებში, როგორიცაა საბანკო სესხები, იპოთეკური სესხები, სამედიცინო გადაწყვეტილებები და დიაგნოზის დასმა. ვიოლეტა მიშევა ფიქრობს, რომ ასეთი დამოკიდებულება არ არის გასაკვირი, რადგან ხშირად თავად მონაცემთა მეცნიერებსაც აქვთ ეჭვები მოდელების შედეგებთან დაკავშირებით. 

“ყველაზე მთავარი, რასაც ML Explainability მოიტანს, არა დახვეწილი ალგორითმები, არამედ ხელოვნური ინტელექტის მიმართ გაზრდილი ნდობაა. ჩვენ უნდა შევძლოთ ფინანსური ინსტიტუტებისთვის, მარეგულირებლებისთვის და ნებისმიერი დაინტერესებული ადამიანისთვის იმის ახსნა, თუ რა შედეგი რატომ დადგა ან დადგება მომავალში და ეს პროცესი უნდა იყოს იმდენად სანდო, რომ ეჭვის შეტანაც კი წარმოუდგენლად გვეჩვენებოდეს”, - ამბობს ვიოლეტა.

დღეს ML Explainability-ის განვითარების ერთ-ერთ შემაფერხებელ ფაქტორად ვიოლეტა არასაკმარის ჩართულობას მიიჩნევს და დაინტერესებულ ადამიანებს მოუწოდებს, რომ შეისწავლონ მონაცემთა მეცნიერის პროფესია და ჩაერთონ ამ პროცესში. მისი აზრით, მომავალ წლებში ეს მიმართულება ერთ-ერთი ყველაზე მოთხოვნადი იქნება, რადგან მისი გავლენა ადამიანების ცხოვრებაზე ყოველდღიურად უფრო იზრდება. 

“რა თქმა უნდა, მომავლის პროგნოზირება დარწმუნებით შეუძლებელია, თუმცა ცხადია, საითკენ მიდის სამყარო. ჩვენ შეგვიძლია ვთქვათ, რომ დღეს ხელოვნური ინტელექტი უკვე ყველა სფეროში არსებობს და მისი გავლენა სულ უფრო იზრდება. დაწყებული Netflix-ის პლატფორმიდან, დამთავრებული ყველაზე რთული ფინანსური ინსტიტუტებით, ყველაფერი დაკავშირებულია ამ პროგრესთან. სწორედ ამიტომ, რაც უფრო მეტი ადამიანი ჩაერთვება პროცესში, უფრო სწრაფად შეიქმნება შესაბამისი ეკოსისტემა”, - გვითხრა ვიოლეტამ. 

ის ფიქრობს, რომ მანქანური სწავლების მოდელების დახვეწით ყველა სფერო მნიშვნელოვნად განვითარდება. მისი პროფილიდან გამომდინარე, გვიყვება, რომ ფინანსური ინსტიტუტები გახდება უფრო სტაბილური და შედეგიანი, რადგან მას უფრო დიდი სიზუსტით შეეძლება კონკრეტული გამოწვევების გადალახვა.

 

“ყველა სფეროს თავისი გამოწვევები აქვს. მაგალითად ფინანსურ ინსტიტუტებს დღეს უამრავი ამოცანა აქვთ დღის წესრიგში, დაწყებული მობაილ ბანკის აპლიკაციიდან, დამთავრებული სესხის გაცემის რისკების უფრო ზუსტი გამოთვლით. დღეს ამ პროცესში AI ტექნოლოგიები უკვე ჩართულია, თუმცა ბუნდოვანებისთვის დიდი სივრცე მაინც რჩება. სწორედ ამ ბუნდოვანების გაფანტვაა ML Explainability-ის მთავარი მისია”, - ვიოლეტა მიშევა.

ამ თემაზე ვიოლეტა მიშევა 13 მაისს, 19:00 საათზე TIDA-შ კონფერენციაზე კიდევ უფრო ვრცლად ისაუბრებს, ამიტომ არ გამოტოვოთ ის. სესიაზე დასწრება თავისუფალია.





ავტორი: დიმა სანაია