Tehnologia de ambalare: metode de prognoză, prognoză euristică. Scurtă prezentare generală a principalelor programe de modelare matematică - Matlab

Cursuri speciale și seminarii speciale în semestrul de primăvară al anului universitar 2018/2019.

25 martie 2019:14:35 – 16:10 master s/c „Analiza graficelor, rețelelor, funcții de similaritate”, Maisuraze A.I., clasa 507 nu va avea loc 25 martie (luni), lectorul este bolnav;
16:20 – 17:55 s/c licență „SQL analitic”, Maisuradze A.I., clasa 582 nu va avea loc 25 martie (luni), lectorul este bolnav.
27.02.2019: Seminar educațional și de cercetare „Data mining: noi sarcini și metode”, conducătorii S.I. Gurov, A.I. Maisuradze Are loc un seminar special în zilele de miercuri în sală. 704, începe la 18-05. 04 martie (luni) la seminarul special va avea loc un raport de I. S. Balashov (Învățământ superior, anul III) „Studiul microbiomului în timpul sarcinii folosind metodele teoriei grafurilor”. Se știe că microorganismele care trăiesc în diverse loci ale corpului interacționează între ele și formează comunități numite microbiom, iar totalitatea acestor microorganisme se numește microbiotă. Pentru o serie de boli, microbiota s-a dovedit a fi un factor de risc pentru dezvoltarea anumitor boli. Datele despre compoziția microbiotei pot fi prezentate sub forma unui grafic, iar apoi caracteristicile acestui grafic pot fi studiate în condiții normale și în patologie. Lucrarea va prezenta caracteristicile domeniului și impactul acestora asupra alegerii metodelor de descriere și analiză a datelor și va prezenta modele de bază care descriu microbiomul.

  • 27.02.2019: Analiza logică a datelor în recunoaștere, (Analiza logica a datelor in recunoastere) lector E.V. Dyukova, are loc luni în cameră. 645, începe la 16-20. Prima lecție pe 25 februarie. Cursul special va sublinia principiile generale care stau la baza metodelor discrete de analiză a informațiilor în problemele de recunoaștere, clasificare și prognoză. Vor fi luate în considerare abordările de proiectare a procedurilor de recunoaștere bazate pe utilizarea aparatului de funcții logice și a metodelor de construire a acoperirilor de matrici booleene și întregi. Vor fi studiate principalele modele și vor fi luate în considerare aspecte legate de studiul complexității implementării lor și a calității rezolvării problemelor aplicate. Curs special pentru licențe de 2-4 ani. A fost publicat un manual pentru cursul special.
  • 27.02.2019: Modelare probabilistică a subiectelor(Modelarea subiectului probabilistic), lector, profesor al Academiei Ruse de Științe, Doctor în Științe Fizice și Matematice. K.V. Vorontsov, are loc joi în cameră. 510, începe la 18-05. Prima lecție pe 14 februarie. Modelarea subiectelor este o zonă modernă de cercetare la intersecția învățării automate și a lingvisticii computaționale. Un model de subiect determină ce subiecte sunt conținute într-o colecție mare de text și la ce subiecte aparține fiecare document. Modelele de subiecte vă permit să căutați texte după semnificație, mai degrabă decât după cuvinte cheie, și să creați un nou tip de servicii de regăsire a informațiilor pentru sistematizarea cunoștințelor. Cursul special examinează modele de subiecte pentru clasificare, categorizare, segmentare, rezumare a textelor în limbaj natural, precum și pentru sisteme de recomandare, analiza datelor tranzacțiilor bancare și a semnalelor biomedicale. Din matematică vom avea nevoie de teoria probabilităților, metode de optimizare și descompunere matriceală. Pentru pasionații de programare, există posibilitatea de a participa la proiectul open source BigARTM.org. Pentru cei care sunt deosebit de entuziaști, există seminarii suplimentare seara la biroul Yandex. Temele de curs vor fi rezolvarea problemelor din viata reala, care nu au răspunsul corect la sfârșitul manualului. Un curs special pentru studenți, dar și studenții din anul II vor înțelege totul :) 18+ (pentru studenții care au învățat teoria).
  • 27.02.2019: Probleme și algoritmi de geometrie computațională(Geometrie computațională: probleme și algoritmi), L.M. Mestetsky, are loc vineri în sala de spectacol. 607, începe la 18-05. Prima lecție pe 15 februarie. Algoritmii eficienți pentru lucrul cu informații geometrice sunt un atribut indispensabil al tuturor sisteme moderne viziune computerizată, analiză și recunoaștere a imaginilor, grafică computerizată și geoinformatică. Algoritmii geometrici oferă un domeniu bun pentru dezvoltarea gândirii algoritmice necesare în matematica aplicată. Prima parte a cursului special va acoperi teme clasice geometrie computațională: căutare geometrică, învelișuri convexe, intersecția și proximitatea obiectelor, diagramele Voronoi, triangulațiile Delaunay. A doua parte a cursului este dedicată scheletelor, generalizărilor diagramelor Voronoi pentru poligoane și problemelor de analiză a formei mediale a imaginilor. Burlacii sunt bineveniți.
  • 27.02.2019: Metode de învățare automată și căutarea regularităților în date, lector O.V. Senko, se desfășoară joi în sală. 507, începe la 18-05. Prima lecție pe 14 februarie. Cursul discută principalele probleme care apar atunci când se utilizează metode de învățare bazate pe cazuri (învățare automată). Este oferită o scurtă prezentare a metodelor existente de recunoaștere și analiză de regresie. Descrie metode de evaluare a acurateței pe o populație generală (capacitate de generalizare). Sunt discutate diferite moduri de a îmbunătăți puterea de generalizare a metodelor de învățare automată. Burlacii sunt bineveniți.
  • 27.02.2019: Analiza graficelor, rețelelor, funcțiilor de similaritate(Grafice, Rețea, Analiza funcției de distanță), A.I. Maisuradze, are loc luni în cameră. 582, începe la 16-20. Prima lecție pe 18 februarie. Sunt luate în considerare problemele și metodele de analiză a sistemelor, a căror descriere se bazează pe interacțiuni perechi sau multiple ale obiectelor. Aceste obiecte pot fi de același tip sau tipuri diferite. Când însăși prezența sau absența interacțiunii este importantă, formalizarea se realizează în limbajul teoriei grafurilor. Extinderea descrierii graficului cu caracteristici cantitative duce la rețele. Dacă se crede că fiecare set de obiecte poate fi caracterizat numeric, se vorbește despre distanțe sau asemănări. Este prezentată o bază teoretică pentru formalizarea problemelor și construirea, implementarea și analiza unei game largi de modele și metode de IAD. Studiem modele de date euristice care descriu informațiile inițiale despre obiectele de recunoaștere pe baza diferitelor implementări ale conceptului de similaritate. Sunt luate în considerare problemele care necesită soluții la implementarea acestor modele. Sunt studiate structuri de date și algoritmi speciali care vă permit să configurați și să utilizați eficient modelele studiate. Ideea de similaritate este caracteristică gândirii umane; aceasta a dat naștere unui întreg set de abordări pentru toate sarcinile fundamentale ale IAD - așa-numitele metode metrice. Sunt luate în considerare metode pentru construirea și calcularea funcțiilor de similaritate, potrivirea asemănărilor pe diverse seturi de obiecte și sintetizarea unor noi metode de comparare a obiectelor pe baza celor existente. Se are în vedere un set de tehnici concepute pentru prezentarea și procesarea eficientă a informațiilor metrice de către sistemele informatice. Sunt luate în considerare caracteristicile graficelor care sunt utilizate în mod activ în analiza lor. Se studiază algoritmii grafici, atât teoretic, cât și din punct de vedere al implementării eficiente. Diverse modele de creștere grafică. Construirea de mostre reprezentative pe grafice. Generarea de grafice cu caracteristici date. O atenție semnificativă în curs este acordată numeroaselor formalizări ale analizei cluster. Se arată ce probleme sunt rezolvate prin metode comune. A fost realizată o tipologie a unei game largi de probleme de clustering pentru sisteme omogene și eterogene (biclustering, coclustering). Curs special pentru studenți.
  • 27.02.2019: SQL analitic(SQL analitic), A.I. Maisuradze, are loc luni în cameră. 507, începe la 14-35. Prima lecție pe 18 februarie. În zilele noastre, automatizarea și optimizarea multor activități este imposibilă fără colectarea și analiza ulterioară a unor volume mari de informații. În același timp, de-a lungul timpului a devenit clar că unele modele de date sunt deosebit de convenabile pentru oameni - astfel de modele au devenit un limbaj universal de comunicare cu o mare varietate de tehnologii. În acest sens, SQL s-a dovedit a fi unul dintre cele mai utilizate limbaje, iar astăzi o varietate de tehnologii (nu doar relaționale) permit utilizarea acestuia. Cursul va folosi exemple practice pentru a oferi cunoștințe și a dezvolta abilități de care aproape orice analist va avea nevoie atunci când lucrează cu surse de date. Accentul se pune pe activități analitice: analistul folosește sisteme pentru colectarea și stocarea datelor, dar nu le va administra. Clasele implică finalizarea interactivă a sarcinilor pe baze de date reale. Curs special pentru burlac.

Observațiile statistice din studiile socio-economice sunt de obicei efectuate în mod regulat la intervale egale și sunt prezentate sub formă de serii de timp xt, Unde t = 1, 2, ..., P. Modelele de regresie a tendințelor sunt utilizate ca instrument de prognoză statistică a seriilor de timp, ai căror parametri sunt estimați folosind baza statistică existentă, iar apoi principalele tendințe (tendințe) sunt extrapolate la un interval de timp dat.

Metodologia de prognoză statistică presupune construirea și testarea multor modele pentru fiecare serie de timp, comparându-le pe baza criteriilor statistice și selectând cele mai bune pentru prognoză.

La modelare fenomene sezoniereÎn studiile statistice se disting două tipuri de fluctuații: multiplicative și aditive. În cazul multiplicativ, intervalul fluctuațiilor sezoniere se modifică în timp proporțional cu nivelul tendinței și se reflectă în modelul statistic printr-un multiplicator. Cu sezonalitate aditivă, se presupune că amplitudinea abaterilor sezoniere este constantă și nu depinde de nivelul tendinței, iar fluctuațiile în sine sunt reprezentate în model printr-un termen.

La baza majorității metodelor de prognoză se află extrapolarea, asociată cu diseminarea tiparelor, legăturilor și relațiilor care funcționează în perioada studiată dincolo de granițele acesteia, sau - într-un sens mai larg al cuvântului - este obținerea de idei despre viitor pe baza informațiilor legate de spre trecut şi prezent.

Cele mai cunoscute și utilizate pe scară largă sunt metodele de prognoză adaptativă și tendințe. Dintre acestea din urmă, se pot evidenția metode precum autoregresia, media mobilă (Box-Jenkins și filtrarea adaptivă), metodele de netezire exponențială (Holt, Brown și media exponențială), etc.

Pentru a evalua calitatea modelului de prognoză studiat, sunt utilizate mai multe criterii statistice.

Cele mai comune criterii sunt următoarele.

Eroare relativă de aproximare:

Unde e t = x t - - eroare de prognoză;

x t - valoarea reală a indicatorului;

- valoarea prezisă.

Acest indicator este utilizat atunci când se compară acuratețea prognozelor de la mai multe modele. Se crede că acuratețea modelului este mare când< 10%, хорошей - при = 10-20% и удовлетворительной - при = 20-50%.

Eroare pătratică medie:

(54.2)

Unde k- numărul de coeficienți de ecuație de estimat.

Alături de prognoza punctuală, prognozele pe intervale sunt utilizate pe scară largă în practica de prognoză. În acest caz, intervalul de încredere este cel mai adesea specificat de inegalități

(54.3)

Unde t α- valoarea tabelului determinată de t-Distribuția elevilor la nivelul de semnificație α și numărul de grade de libertate p - k.

Un număr mare de modele matematice și statistice sunt prezentate în literatura de specialitate pentru a descrie în mod adecvat diversele tendințe în serii de timp.

Cele mai comune tipuri de modele de tendințe care caracterizează o creștere sau o scădere monotonă a fenomenului studiat sunt:

(54.4)

Un model corect ales trebuie să corespundă naturii modificărilor de tendință a fenomenului studiat; În acest caz, valoarea lui e t ar trebui să fie aleatoriu cu medie zero.

În plus, erori de aproximare e t trebuie să fie independenți unul de celălalt și să respecte legea distribuției normale e t Î N (0, σ ). Independența erorilor e t , acestea. absența autocorelației reziduurilor este de obicei verificată cu ajutorul testului Durbin-Watson, bazat pe statistici:

(54.5)

Unde e t = xt - .

Dacă abaterile nu sunt corelate, atunci valoarea DW aproximativ egal cu doi. În prezenţa autocorelaţiei pozitive 0 ≤ DW 2, și negativ - 2 ≤ D W ≤ 4.

Corelația reziduurilor poate fi judecată și prin corelograma pentru abaterile de la tendință, care este un grafic al funcției relativ la τ al coeficientului de autocorelare, care este calculat prin formula

(54.6)

unde τ = 0, 1, 2 ... .

Odată ce funcția analitică cea mai potrivită pentru o tendință este selectată, aceasta este utilizată pentru a face predicții bazate pe extrapolări pe un anumit număr de intervale de timp.

Să luăm în considerare problema netezirii fluctuațiilor sezoniere pe baza seriei Vt = x t - , Unde x t - valoarea seriei temporale originale în acest moment t, A - estimarea valorii tendinței corespunzătoare ( t = 1, 2, ..., P).

Deoarece fluctuațiile sezoniere sunt un proces ciclic care se repetă în timp, următoarele serii armonice (seria Fourier) sunt utilizate ca funcții de netezire:

Estimări ale parametrilor α iși β i modelele sunt determinate din expresii

(54.7)

Unde k = P / 2 - numărul maxim admis de armonici;

ω i= 2π i/ P - frecventa unghiulara i armonicele-le-a ( i = 1, 2, ..., T).

Lăsa T - numărul de armonici utilizate pentru a netezi variațiile sezoniere (T< k). Apoi estimarea pentru seria armonică are forma

(54.8)

iar valorile calculate ale seriilor temporale ale indicatorului inițial sunt determinate de formulă

54.2. Metode adaptive de prognoză

Atunci când se utilizează modele de tendințe în prognoză, se presupune de obicei că principalii factori și tendințe din perioada trecută vor rămâne pentru perioada de prognoză sau că direcția schimbărilor lor în viitor poate fi justificată și luată în considerare. Cu toate acestea, în prezent, când are loc restructurarea structurală a economiei, procesele socio-economice chiar și la nivel macro devin foarte dinamice. În acest sens, cercetătorul se ocupă adesea de fenomene noi și serii de timp scurte. În același timp, datele învechite în timpul modelării se dovedesc adesea a fi inutile și chiar dăunătoare. Astfel, este nevoie de a construi modele bazate în principal pe o cantitate mică din cele mai recente date, dotând modelele cu proprietăți adaptive.

Metodele adaptive ar trebui să joace un rol important în îmbunătățirea prognozei, al cărei scop este acela de a construi modele auto-ajustabile care sunt capabile să țină cont de valoarea informațională a diferiților membri ai unei serii de timp și să ofere estimări destul de precise ale viitorilor membri ai acestei serii. . Modelele adaptive sunt destul de flexibile, dar nu se poate conta pe universalitatea și adecvarea lor pentru orice serie de timp.

La construirea unor modele specifice, este necesar să se țină seama de cele mai probabile modele de dezvoltare a procesului real. Cercetatorul trebuie sa includa in model acele proprietati adaptative care sunt suficiente pentru a monitoriza procesul real cu o acuratete data.

Originile direcției adaptive se află în cel mai simplu model de netezire exponențială, a cărui generalizare a dus la apariția unei întregi familii de modele adaptative. Cel mai simplu model adaptiv se bazează pe calcularea unei medii mobile ponderate exponențial.

Netezirea exponențială a seriei temporale originale xt efectuate după formula recurentă

(54.9)

Unde S t - valoarea mediei exponenţiale în acest moment t, A . S t-1- pe moment t-1;

α - netezire, parametru de adaptare, α = const, 0< α < 1;

Expresia (54.9) poate fi reprezentată ca

În (54.10) media exponențială la momentul actual t exprimată ca media exponențială a momentului precedent S t-1 plus fracția α a varianței observației curente x t de la media exponenţială S t-1 moment t- 1.

Folosind în mod consecvent relația de recurență (54.9), putem exprima media exponențială S t prin valorile serii temporale:

Unde S 0 - o cantitate care caracterizează condițiile inițiale pentru prima aplicare a formulei (54.9), cu t = 1.

Deoarece β = (1 - α)< 1, то при t 0 β t 0 și, conform (54.11),

(54.12)

acestea. magnitudinea S t se dovedește a fi suma ponderată a tuturor termenilor seriei. În acest caz, ponderile scad exponențial în funcție de durata de observație, de unde și denumirea S t - medie exponenţială.

Din (54.12) rezultă că creșterea ponderii observațiilor mai recente poate fi realizată prin creșterea α. În același timp, pentru a netezi fluctuațiile aleatorii din seria temporală xt valoarea lui α trebuie redusă. Cele două cerințe de mai sus sunt în conflict, iar în practică, atunci când se alege α, ele pornesc de la o soluție de compromis.

Netezirea exponențială este cel mai simplu tip de model de auto-învățare cu un parametru de adaptare α. Au fost dezvoltate mai multe variante de modele adaptive care utilizează procedura de netezire exponențială și permit luarea în considerare a prezenței xt tendințe și variații sezoniere. Să ne uităm la câteva dintre aceste modele.

Model polinom adaptiv de ordinul întâi

Să luăm în considerare algoritmul de netezire exponențială, care presupune că seria temporală are xt tendință liniară. Modelul se bazează pe ipoteza că prognoza poate fi obținută din ecuație

Unde - valoarea estimată a seriei temporale în acest moment ( t + τ);

, - estimări ale coeficienților adaptativi ai polinomului de ordinul întâi la momentul actual t;

τ - valoarea plumbului.

Mediile exponențiale ale ordinului 1 și 2 pentru model au forma

(54.13)

unde β = 1 - α, iar estimarea valorii modelului seriei cu o perioadă de avans τ este egală cu

(54.14)

Pentru a determina inițial condițiile inițiale folosind date din seria temporală xt găsim estimarea tendinței liniare folosind metoda celor mai mici pătrate:

și acceptă Și . Atunci condițiile inițiale sunt definite astfel:

(54.15)

Întrebări de control

1. Ce modele de prognoză cunoașteți și care sunt caracteristicile acestora?

2. Care este abordarea statistică a prognozării, modelării tendințelor și a fenomenelor sezoniere în cercetarea strategică?

3. Ce modele în tendințe cunoașteți și cum este evaluată calitatea acestora?

4. Care sunt caracteristicile metodelor adaptive de prognoză?

5. Cum se realizează netezirea exponențială a unei serii de timp?

Anexa 1. METODE DE ANALIZĂ ȘI PREVIZIONARE STATISTICĂ ÎN AFACERI

4. Instrumente matematice de prognoză

Metode matematiceși modelele utilizate în problemele de analiză stocastică și prognoză în afaceri se pot raporta la o varietate de ramuri ale matematicii: analiza regresiei, analiza serii cronologice, formarea și evaluarea opiniilor experților, modelarea prin simulare, sisteme de ecuații simultane, analiza discriminantă, logit și probit. modele, aparatul funcțiilor de decizie logică, analiza de dispersie sau covarianță, analiza corelațiilor de rang și a tabelelor de contingență etc. Cu toate acestea, toate sunt unite prin faptul că reprezintă abordări diferite de rezolvare. problema centrala analiză statistică multivariată și econometrie – probleme de cercetare statistică a dependenţelor, care este tocmai problema de baza a analizei si prognozei statistice in afaceri (formularea sa generală a fost dată în paragraful 2).

La paragraful 1 s-a remarcat deja că printre p + k + l + m Componenta caracteristicii multidimensionale analizate poate fi variabile cantitative, ordinale sau nominale. Abordările menționate mai sus pentru rezolvarea problemei centrale a analizei statistice multivariate au fost formate tocmai ținând cont de natura variabilelor studiate. Specializarea corespunzătoare a acestor abordări este reflectată în Tabel. 4. Conține și referințe la surse literare în care se poate găsi o descriere destul de completă a acestor abordări.

Tabelul 4.

Natura indicatorilor rezultați

Natura variabilelor explicative

Numele secțiunilor suport ale analizei statistice multivariate

Izvoarele literare

Cantitativ

Cantitativ

Analiza regresiei și sisteme de ecuații simultane

Cantitativ

Singura variabilă cantitativă interpretată ca „timp”

Analiza serii temporale

Cantitativ

necantitative (variabile ordinale sau nominale)

Analiza variatiei

Cantitativ

Analiza covarianței, modele de regresie tipologică

non-cantitative (variabile ordinale)

Non-cantitative (variabile ordinale și nominale)

Analiza corelațiilor de rang și a tabelelor de contingență

non-cantitative (variabile nominale)

Cantitativ

Analiză discriminantă, modele logit și probit, analiză cluster, taxonomie, împărțirea amestecurilor de distribuții

Mixt (variabile cantitative și necantitative)

Mixt (variabile cantitative și necantitative)

Rezolvator logic, Data Mining

Cu toate acestea, practica analizei statistice și previziunii în afaceri indică faptul că, în întreaga gamă a instrumentelor lor matematice, conducerea de necontestat (în ceea ce privește prevalența și relevanța) aparține trei secțiuni:
- analiza regresiei;
-
analiza serii temporale;
-
mecanism pentru formarea și analiza statistică a evaluărilor experților.

Să ne uităm pe scurt la fiecare dintre aceste secțiuni.

Analiza regresiei

Ca și mai înainte, vom descrie funcționarea obiectului real studiat (firmă, firmă, proces de producție sau distribuție de produse etc.) cu un set de variabile și (sensul lor de fond este descris în paragraful 2). Să introducem o serie de definiții și concepte utilizate în analiza regresiei.

Variabile rezultate (dependente, endogene). O variabilă care caracterizează rezultatul sau eficiența funcționării sistemului analizat se numește rezultantă (dependentă, endogenă). Valorile sale se formează în procesul și în funcționarea acestui sistem sub influența unui număr de alte variabile și factori, dintre care unii pot fi înregistrați și, într-o anumită măsură, gestionați și planificați (această parte este de obicei numită variabile explicative, vezi mai jos). În analiza de regresie, variabila rezultată acționează ca o funcție, ale cărei valori sunt determinate (deși cu o oarecare eroare aleatorie) de valorile variabilelor explicative menționate mai sus, care acționează ca argumente. Prin urmare, prin natura sa, variabila rezultată este întotdeauna stocastică (aleatorie). În cazul general, comportamentul mai multor variabile rezultate este de obicei analizat simultan. .

Variabile explicative (predictoare, exogene). . Variabilele (sau atributele) care pot fi înregistrate, descriu condițiile de funcționare ale sistemului economic real studiat și determină în mare măsură procesul de formare a valorilor variabilelor rezultate sunt numite explicative. De regulă, unele dintre ele pot fi cel puțin parțial reglementate și gestionate. Valorile unui număr de variabile explicative pot fi setate ca și cum ar fi „din exterior” sistemului analizat. În acest caz, ele sunt de obicei numite exogene. În analiza de regresie, ele joacă rolul de argumente ale funcției în care este considerat indicatorul rezultat analizat. Prin natura lor, variabilele explicative pot fi aleatoare sau nealeatoare.

Reziduuri de regresie– acestea sunt componente aleatorii latente (adică ascunse, nu direct măsurabile), reflectând influența, respectiv, asupra factori neluați în considerare, precum și erori aleatorii în măsurarea variabilelor rezultate analizate. În general, ele pot depinde și de , adică în cazul general.

Schema generală de interacțiune a variabilelor în analiza de regresie este prezentată în figură.




Desen . Schema generală de interacțiune a variabilelor în analiza de regresie.

Funcția de regresie De. Funcția este numită functie de regresie de (sau pur și simplu - regresie De), dacă descrie modificarea valorii medii condiționate a variabilei rezultate (cu condiția ca valorile variabilelor explicative să fie fixate la niveluri) în funcție de modificarea valorilor variabilelor explicative. În consecință, matematic această definiție poate fi scrisă sub forma

unde simbolul înseamnă operația de mediere teoretică a valorilor (adică este așteptarea matematică a unei variabile aleatoare și, sau pur și simplu, este așteptarea matematică condiționată a unei variabile aleatoare, calculată cu condiția ca valorile variabilele explicative sunt fixate la nivel).

Dacă analizăm simultan variabilele rezultate, atunci ar trebui să luăm în considerare, respectiv, funcțiile de regresie sau, ceea ce este la fel, una cu valoare vectorială funcţie

. (11)

Apoi modelul de regresie poate fi scris sub forma

, (12)

Mai mult, din definiție rezultă că întotdeauna]

(12’)

(identic semnul egal în (12’) înseamnă că este valabil când orice valori; vectorul coloană cu zerouri din partea dreaptă are dimensiunea ).

problema analizei regresieiîn forma sa cea mai generală poate fi formulată după cum urmează:

pe baza rezultatelor măsurătorilor

a variabilelor studiate asupra obiectelor (sistemelor, proceselor) populației analizate, construiți o astfel de funcție (valorică vectorială) (11) care să permită cel mai bun (într-un anumit sens) mod de a restabili valorile rezultatului. variabile (prevăzute). în funcție de valorile date ale variabilelor explicative (exogene).

Nota 1. Cele mai frecvente sunt liniar modele de regresie, adică modele în care funcțiile de regresie au o formă liniară:

Observația 2. Există cel puțin două opțiuni pentru interpretarea variabilelor „comportamental”, „status” și, respectiv, „externă” introduse în paragraful 2, și în cadrul modelului de regresie descris (12)–(12’). În prima versiune toate cele trei tipuri variabile și sunt clasificate ca variabile explicative și se construiește o regresie pe . Într-un alt exemplu de realizare, variabilele și sunt interpretate ca conditii de observatieși apoi separat pentru fiecare combinație fixă ​​a acestor condiții, se construiește un model de regresie de forma (12) (în cadrul modelului liniar (12 '') aceasta va însemna că coeficienții de regresie înșiși depind de și , adică sunt definite ca funcții ale și ).

Analiza serii temporale

Orice analiză și prognoză statistică se bazează pe date statistice inițiale. Principalele lor tipuri au fost prezentate în paragraful 1. Mai mult, dacă procesul de înregistrare a datelor are loc în timp, iar timpul în sine este înregistrat împreună cu valorile caracteristicilor analizate, atunci vorbim despre analiza statistică a așa-numitelor datele panoului. Dacă fixăm numărul variabilei și numărul obiectului examinat statistic, atunci situat în ordine cronologica succesiune de valori

numit serii de timp univariate. Dacă luăm în considerare simultan seriile temporale unidimensionale de forma (13), adică examinăm modelele din interconectate comportamentul seriilor temporale (13) pentru , care caracterizează dinamica variabilelor, măsurată pe doar unul(-m) obiect, apoi vorbesc despre analize statistice serii temporale multivariate. În esență, toate sarcinile legate de analiza dinamicii economice și previziunile implică utilizarea unor serii temporale ale anumitor indicatori ca bază statistică a acestora.

De regulă, numai în probleme de prognoză de afaceri discret (prin timpul de observare) serii de timp univariate pentru momente de observare echidistante, adică unde este un anumit pas de timp (minut, oră, zi, săptămână, lună, trimestru, an etc.). În aceste cazuri, ne va fi mai convenabil să reprezentăm seria temporală studiată în formular

unde este valoarea indicatorului analizat înregistrată în pasul de timp.

Vorbind despre utilizarea aparatelor de analiză a seriilor de timp în problema de prognoză, ne referim scurt- si pe termen mediu prognoza, încă de la construcție termen lung prognoza presupune folosirea obligatorie a metodelor de organizare si analiza statistica expertize speciale.

Geneza observațiilor care formează o serie temporală. Este despre despre structura și clasificarea principalilor factori sub influența cărora se formează valorile elementelor unei serii de timp. Este recomandabil să distingem următoarele 4 tipuri de astfel de factori.

(A) Termen lung, formând o tendință generală (pe termen lung) de modificare a caracteristicii analizate. De obicei, această tendință este descrisă folosind una sau alta funcție non-aleatorie f tr (t), de obicei monoton. Această funcție este numită funcția de tendință sau pur și simplu tendinţă.

(B) Sezonier, formând periodic fluctuaţii repetate ale caracteristicii analizate la o anumită perioadă a anului. Să fim de acord să notăm rezultatul acțiunii factorilor sezonieri folosind o funcție non-aleatorie. Pentru că această funcție ar trebui să fie periodic(cu perioade care sunt multipli de anotimpuri, adică sferturi), expresia sa analitică implică armonici (funcții trigonometrice), a căror periodicitate, de regulă, este determinată de esența substanțială a problemei.

(ÎN) Ciclic (oportunist), formând modificări ale caracteristicii analizate, cauzate de acțiunea unor cicluri de lungă durată de natură economică, demografică sau astrofizică (valuri Kondratiev, „găuri” demografice, cicluri de activitate solară etc.). Vom nota rezultatul acțiunii factorilor ciclici folosind o funcție non-aleatorie.

(G) Aleatoriu(neregulat), nesupus contabilității și înregistrării. Impactul lor asupra formării valorilor seriilor temporale este tocmai ceea ce determină natura stocastică elemente și, prin urmare, necesitatea interpretării ca observații făcute asupra variabilelor aleatoare. Vom nota rezultatul influenței factorilor aleatori folosind variabile aleatoare („reziduale”, „erori”). Desigur, nu este deloc necesar ca factorii să participe simultan la procesul de formare a valorilor oricărei serii cronologice toata lumea patru tipuri. În unele cazuri, valorile unei serii temporale pot fi formate sub influența factorilor (A), (B) și (D), în altele - sub influența factorilor (A), (B) și (D). ) și, în sfârșit, numai sub influența factorilor aleatori (G). Cu toate acestea, în toate cazurile se presupune participarea indispensabilă a unor oameni la întâmplare (evolutiv) factorii (D).În plus, este general acceptat (ca ipoteză) aditiv structural sistem influența factorilor (A), (B), (C) și (D) asupra formării valorilor, ceea ce înseamnă legitimitatea prezentării valorilor membrilor seriilor temporale sub forma unei expansiuni:

Concluziile despre dacă factori de acest tip sunt implicați sau nu în formarea valorilor se pot baza fie pe o analiză a esenței de fond a sarcinii (adică să fie a priori-expert prin natura sa), și pe special analiza statistică a seriei temporale studiate.

În cadrul conceptelor și denumirilor introduse problema analizei statistice a seriilor temporaleîn general poate fi formulată după cum urmează:

Pe baza rezultatelor măsurătorilor variabilei studiate în ciclurile de timp ale perioadei de bază, construiți cele mai bune (într-un anumit sens) estimări pentru termenii de expansiune (14).

Soluția acestei probleme este utilizată pentru a construi o valoare de prognoză pentru pașii de timp înainte folosind formula (14) când și când se înlocuiesc în ea estimările obținute ale componentelor părții drepte a expansiunii.

Mecanisme de formare și analiză statistică a evaluărilor experților

De obicei, se disting următoarele tipuri principale de organizare a muncii unui grup de experți:

· colegial: „metoda comisiei” (sub forma unei discuții deschise asupra problemei în discuție); „metoda de judecată” (sub formă de confruntare între „apărare” și „urmare în judecată” pentru fiecare dintre opțiunile de soluționare discutată a problemei); „brainstorming” etc.;

· parțial colegial: analiza de scenariu de tip „ce-ar fi”, metoda „Delphi” – o discuție în mai multe runde a problemei cu un vot secret al experților sau completarea chestionarelor speciale anonime la sfârșitul fiecărei runde și munca unui analitic independent. grupare în intervalele dintre runde etc.;

· autonom individual: fiecare membru al grupului de experți își formează și își exprimă opinia (indiferent de pozițiile celorlalți participanți) sub forma ierarhizării opțiunilor (sau obiectelor) de soluție discutate, a comparațiilor lor pe perechi sau atribuirea fiecăruia dintre ele uneia dintre gradațiile descrise anterior. (vezi formularele de prezentare a datelor statistice inițiale sub formă de tabele de frecvență sau tabele de contingență între opiniile experților al treilea și al celui de al treilea sunt măsurate prin valoarea , unde este coeficientul de corelație a rangului Spearman (vezi, Capitolul 11]). sau o altă metodă de calculare a „distanței” dintre opiniile unei perechi de experți, putem apoi rezolva problema „clusteringului” experților, interpretând fiecare dintre clusterele găsite în acest fel ca un grup de experți asemănători.

(ii) Analiza coerenței reciproce a opiniilor grupului de experți. Având opiniile unui întreg grup de experți, analistul statistic urmărește să evalueze gradul de consistență al tuturor acestor evaluări ale experților, inclusiv testarea statistică a ipotezei despre absența completă a oricărei consecvențe (și apoi, evident, ar trebui fie să clarifice formularea a problemei propuse experților, sau schimbarea compoziției grupului de experți). Această problemă este rezolvată și prin intermediul analizei statistice multivariate. Alegerea unei metode specifice depinde de forma datelor statistice surse. De exemplu, dacă opiniile experților sunt reprezentate de clasamente, atunci poate fi luată în considerare o măsură a coerenței lor coeficientul obiectului), adică cu date statistice inițiale ale formei se determină ca soluție la o problemă de optimizare a formei j Cu cât distanța este cel de-al treilea expert față de o opinie unică de grup, cu atât este mai scăzut nivelul competenței sale relative. Rețineți că dacă, în urma studierii structurii unui set de opinii ale experților, un analist statistic ajunge la concluzia că există mai multe subgrupuri de experți cu omogenitate de opinii în cadrul fiecărui subgrup și cu o diferență semnificativă de opinii în orice pereche de astfel de subgrupuri, atunci sarcina unui singur grup de opinie și evaluare a competenței relative a expertului se rezolvă separat pentru fiecare dintre subgrupele identificate.


Factorii aleatori, la rândul lor, pot fi de două naturi: brusc(„dezordonare”), ducând la schimbări structurale abrupte în mecanismul de formare a sensului x(t)(care se exprimă, de exemplu, în schimbări radicale abrupte ale caracteristicilor structurale de bază ale funcțiilor f tr(t), j(t)Și y(t) seria cronologică analizată într-un moment aleator în timp) și rezidual evolutiv, provocând abateri aleatoare relativ mici ale valorilor x(t) din cele care ar fi trebuit să iasă numai sub influența factorilor (A), (B) și (C). Cu toate acestea, în această secțiune vom lua în considerare scheme pentru formarea seriilor temporale, inclusiv acțiunea doar evolutiv factori aleatori reziduali.

Anterior

METODE MATEMATICE DE PREVIZARE ÎN MANAGEMENTUL ÎNTREPRINDERILOR

Kovalciuk Svetlana Petrovna

Student în anul IV, Departamentul de Cibernetică Economică, VNAU, Vinnitsa

Kolyadenko Svetlana Vasilievna

conducător științific, doctor în economie, profesor la VNAU, Vinnitsa

Introducere.În condițiile dezvoltării relațiilor de piață pentru a asigura un management eficient al întreprinderii, adoptarea decizii de management este necesar să se efectueze o analiză aprofundată a indicatorilor economici ai activităților sale în dinamică, ceea ce face posibilă, folosind metode de prognoză pe măsură ce noi informații devin disponibile, identificarea modelelor de schimbări în timp și determinarea modalităților rezonabile de dezvoltare a obiectul de management.

Analiza celor mai recente cercetări și publicații. Problema prognozei a fost studiată în lucrările științifice ale unor economiști interni și străini celebri precum I. Ansoff, V. Geets, G. Dobrov, M. Dolishny, A. Ilishev, M. Kizim, V. Kucheruk, V. Lisichkin, A. Melnik, M. Meskon, Z. Mykytyshyn, I. Mikhasyuk, B. Panasyuk, M. Porter, G. Savitskaya, R. Sayfulin și alții. Cu toate acestea, există o nevoie obiectivă de cercetări suplimentare asupra fundamentelor metodologice și aplicate ale previziunii activităților întreprinderilor, ținând cont de particularitățile formării unei economii de piață.

Scopul studiului este sistematizarea metodelor matematice de prognoză economică în managementul întreprinderii, determinarea caracteristicilor, sarcinilor și principiilor acestora.

Principalele rezultate ale studiului. O prognoză (din grecescul prognostic - previziune) este o încercare de a determina starea unui fenomen sau proces în viitor. Procesul de formare a unei prognoze se numește prognoză. Prognoza în managementul întreprinderii este o fundamentare științifică a posibilelor modificări cantitative și calitative ale stării sale, ale nivelului de dezvoltare în ansamblu, domeniilor individuale de activitate în viitor, precum și modalități alternative și calendarul de atingere a stării așteptate.

Procesul de prognoză se bazează întotdeauna pe anumite principii:

  • scop – o descriere semnificativă a sarcinilor de cercetare atribuite;
  • sistematic - construirea unei prognoze bazată pe un sistem de metode și modele care se caracterizează printr-o anumită ierarhie și succesiune;
  • validitate științifică - luarea în considerare cuprinzătoare a cerințelor legilor obiective ale dezvoltării sociale, utilizarea experienței mondiale;
  • descriere pe mai multe niveluri – descrierea unui obiect ca fenomen integral și în același timp ca element al unui sistem mai complex;
  • unitate informațională - utilizarea informațiilor pentru generalizarea și integritatea caracteristicilor la fel de egale;
  • adecvarea la modelele obiective de dezvoltare - identificarea și evaluarea relațiilor stabile și a tendințelor de dezvoltare ale obiectului;
  • soluție consistentă a incertitudinii - o procedură pas cu pas pentru trecerea de la identificarea obiectivelor și condițiilor existente la determinarea posibilelor direcții de dezvoltare;
  • alternativitate - identificarea posibilității de dezvoltare a unui obiect supus diferitelor traiectorii, diverse relații și relații structurale.

Prognoza îndeplinește trei funcții principale și are trei etape:

  • prevederea posibilelor tendințe de schimbări în viitor, identificarea tiparelor, tendințelor, factorilor care provoacă aceste schimbări (etapa de cercetare);
  • identificarea opțiunilor alternative de influențare a dezvoltării unui obiect ca urmare a luării anumitor decizii, evaluarea consecințelor implementării acestor decizii (etapa de justificare a deciziilor de management);
  • evaluarea rezultatelor deciziilor de implementare, schimbări neprevăzute în mediul extern, în vederea coordonării în timp util a deciziei (etapa de observare și corectare).

Aceste trei funcții și trei etape se împletesc reciproc, se repetă iterativ și sunt elemente integrante ale activității de management în orice domeniu.

Calitatea prognozelor depinde în mare măsură de metodele de prognoză, care sunt un set de tehnici și evaluări care fac posibilă, pe baza unei analize a conexiunilor interne și externe trecute (retrospective) inerente unui obiect, precum și a modificărilor acestora, să se creeze o concluzie cu o anumită probabilitate privind dezvoltarea viitoare a obiectului.

Pe baza principiului justificării informațiilor, se disting următoarele metode:

eu. Metode faptice care se bazează pe materiale informaționale faptice despre obiectul prognozat și evoluția sa anterioară:

  • metode statistice: extrapolare și interpolare, analiza de corelație și regresie, modele factoriale;
  • analogii: matematice, istorice;
  • metode avansate de prognoză, care se bazează pe anumite principii de prelucrare specială a informațiilor științifice și tehnice și implementează în prognoză proprietatea acesteia de a depăși dezvoltarea progresului științific și tehnologic (metode de analiză a dinamicii brevetării, metode de previziune a publicării).

II. Metode expert, care se bazează pe informații subiective furnizate de specialiști experți în procesul de proceduri sistematice de identificare și rezumare a gândurilor lor cu privire la starea viitoare a lucrurilor. Aceste metode se caracterizează prin prevederea viitorului bazată atât pe dovezi raționale, cât și pe cunoștințe intuitive. Ele sunt de obicei de natură calitativă. Aceste metode includ următoarele:

  • direct: interogatoriu expert; analiză de experți, atunci când un expert sau o echipă de experți pun ei înșiși și rezolvă întrebări care conduc la obiectivul stabilit; cu feedback; metoda „comisionului”, care poate însemna organizarea unei „mese rotunde” și a altor evenimente similare, în cadrul cărora se convine asupra gândurilor experților; metoda „brainstorming”, care se caracterizează prin generarea colectivă de idei și rezolvarea creativă a problemelor; metoda Delphi, care presupune efectuarea de anchete prin chestionar ale specialiștilor din domeniul de cunoaștere ales.

III. Metode combinate cu o bază informațională mixtă, în care informațiile de fapt și de expertiză sunt utilizate ca informații primare: modele de bilanţ; modele de optimizare.

Una dintre cele mai comune metode de prognoză sunt metodele econometrice - acesta este un complex de discipline științifice economice și matematice care studiază procesele și sistemele economice. Un model econometric este un sistem de ecuații și identități de regresie (stochastice). Coeficienții ecuațiilor sunt determinați prin metode de statistică matematică bazate pe informații economice și statistice specifice, iar cea mai comună metodă de cuantificare a coeficienților este metoda celor mai mici pătrate cu modificările acesteia. Ecuațiile econometrice exprimă dependența variabilelor studiate de modificările altor indicatori, inclusiv de starea acestor variabile în trecut. Identitățile stabilesc interdependență între variabile care reflectă structura statisticilor utilizate.

Platforma matematică a modelelor econometrice constă din metode de corelare și analiză de regresie. Analiza corelației face posibilă selectarea celor mai semnificativi factori și construirea ecuației de regresie corespunzătoare.

Analiza corelației oferă: măsurarea gradului de legătură între două sau mai multe variabile; identificarea factorilor care influențează cel mai semnificativ variabila dependentă; determinarea unor legături cauzale necunoscute anterior (corelația nu relevă direct legături cauzale între fenomene, ci determină valoarea numerică a acestor legături și probabilitatea judecăților privind existența lor). Principalele mijloace de analiză sunt coeficienții de corelație perechi, parțiali și multipli.

Analiza regresiei vă permite să rezolvați următoarele probleme:

  • stabilirea formelor de dependenţă între o variabilă endogene şi una sau mai multe variabile exogene (pozitive, negative, liniare, neliniare). De obicei se notează o variabilă endogenă Y, și exogen (exogen), care se mai numește și regresor, – X;
  • definirea functiei de regresie. Este important nu numai să se indice tendința generală de modificare a variabilei dependente, ci și să se afle gradul de influență asupra variabilei dependente a factorilor principali dacă factorii rămași (minori, secundari) nu s-au modificat (au fost la același nivel mediu) și elemente aleatorii au fost excluse;
  • estimarea valorilor necunoscute ale variabilei dependente.

În funcție de scopul previziunii, se determină setul și structura variabilelor care sunt incluse în model. Pe baza unei analize teoretice a relațiilor dintre variabile, se formează un sistem de ecuații și se estimează parametrii ecuațiilor de regresie. Ca urmare a luării în considerare a diferitelor opțiuni pentru structurile ecuațiilor, cele care au cele mai bune caracteristici calitative și nu contrazic teoria economică rămân în sistem. Iar ultima etapă a construirii modelului conține un test al capacității acestuia de a recrea dinamica dezvoltării economice trecute, de exemplu. simulare pe un model de perioadă de bază, care permite evaluarea calității acestuia.

Obiectele previziunii în managementul întreprinderii pot fi: cererea, producția de produse (performanța serviciilor), volumul vânzărilor, necesarul de material și resurselor de muncă, costurile de producție și vânzarea produselor, prețurile, veniturile întreprinderii, dezvoltarea tehnică a acesteia.

Subiectele previziunii sunt departamentele de planificare și economice ale întreprinderii, departamentele de marketing și tehnică.

Elaborarea planurilor de prognoză (pe viitor, pe termen scurt (an, trimestru, lună) și operaționale (zi, deceniu)) are loc atât pentru întreprindere în ansamblu, cât și pentru diviziile sale structurale: ateliere, secții, servicii. La prezicerea indicatorilor, se recomandă utilizarea următorului sistem de metode: evaluări experți, modele factoriale, metode de optimizare, metodă normativă.

Concluzii. Pentru a lua o decizie, este necesar să aveți informații fiabile și complete, pe baza cărora se formează o strategie de producție și vânzare de produse. În acest sens, rolul previziunilor este în creștere, extinderea necesară a sistemului și îmbunătățirea metodelor de prognoză utilizate în practică. O atenție deosebită trebuie acordată prognozării cererii de produse, costurilor de producție, prețurilor și profiturilor. În acest scop, se efectuează un studiu al pieței interne și mondiale și se realizează o analiză a elasticității cererii.

Bibliografie:

  1. Luginin O.E. Econometrie: manual. ajutor pentru elevi educatie inalta administrator – Ed. a II-a, revizuită. si suplimentare – K.: Centru literatură educațională, 2008. – 278 p.
  2. Orlov A.I. Econometrie. – M.: Examen, 2002. – 576 p.
  3. Prisenko G. V., Ravikovich E. I. Prognoza proceselor socio-economice: manual. indemnizatie – K.: KNEU, 2005. – 378 p.
  4. Stetsenko T. O., Tishchenko O. P. Managementul economiei regionale: manual. indemnizatie Instituția de învățământ superior de stat Kiev. naţional econ. Universitatea poartă numele V. Getman. – K.: KNEU, 2009. – 471 p.
  5. Yakovets Yu.V. Cicluri de prognoză și crize. – M.: MFK, 2000. – P. 42.

Matematicianul Konstantin Vorontsov despre utilizarea problemelor de învățare automată în afaceri, compozițiile modelelor adaptive și îmbunătățirea calității datelor

În urmă cu zece ani, un mare lanț de retail a anunțat o licitație pentru a rezolva problema prognozării volumelor de vânzări în rețeaua sa. Aproape toți marii comercianți cu amănuntul rezolvă problemele de prognoză deoarece au nevoie de el pentru a planifica achizițiile. Condițiile competitive au fost stabilite astfel: ni s-au dat date pentru doi ani - sunt vânzări zilnice de aproximativ 12.000 de produse într-unul dintre magazinele lanțului, licitația a fost închisă, pe lângă noi, au mai fost invitate șase companii. Printre aceștia s-au numărat și furnizori foarte mari de soluții analitice pentru retail. Noi, desigur, am evaluat șansele noastre de a câștiga această licitație ca fiind mici.

Condiția a fost crearea unei previziuni de vânzări pentru cele două săptămâni care au urmat imediat celor doi ani pentru care erau disponibile date. Organizatorii competiției au oferit o funcționalitate proprie de calitate, care a fost folosită pentru a măsura calitatea prognozelor. Această funcționalitate a fost puțin nestandard. Organizatorii au decis să țină cont de faptul că această funcționalitate include un numar mare de mărfuri și nu este bine când adunați bucăți cu kilograme, deci era suma tuturor mărfurilor și au trebuit să pună valoarea prezisă ca numitor. Aceasta nu a fost o mișcare foarte clară; de obicei nu fac asta. Am avertizat organizatorii competiției că funcționalitatea a fost puțin ciudată, despre acest lucru i-au avertizat și alți participanți la competiție, dar, cu toate acestea, această decizie a avut și propria ei logică, iar competiția s-a desfășurat în astfel de condiții.

De regulă, prognoza cererii consumatorilor – mai precis, volumele vânzărilor – se face folosind metode de prognoză cunoscute în statistică de foarte mult timp. În general, acestea se bazează pe metoda celor mai mici pătrate, în care funcționalitatea include sume pe produs, sume pe momente de timp și pătratul diferenței dintre prognoza algoritmului și volumul real de vânzări pentru acest produs în ziua respectivă. Așa este de obicei aranjată funcționalitatea și, în toate soluțiile standard, minimizarea unei astfel de funcționalități vă permite să personalizați algoritmul de prognoză.

Există multe metode simple, de lucru rapid, cunoscute și de multă vreme, începând cu anii 1960, pe care am început să le folosim pentru a rezolva problema prognozei. Acestea sunt metodele de medie mobilă exponențială, modelele Brown, Theil-Wage, Holt-Winters și așa mai departe. Unele dintre ele țin cont de sezonalitate. Sezonalitatea nu trebuie înțeleasă ca iarnă – vară, ci mai degrabă ca zile lucrătoare – weekenduri, adică sezonalitate săptămânală. Multe articole se vând de fapt diferit în zilele lucrătoare și în weekend. Ne-am dat seama imediat că principalii noștri concurenți din această licitație vor folosi abordări standard: ar folosi metoda celor mai mici pătrate, deoarece au soluții gata făcute și metode de calcul mai degrabă laborioase, cum ar fi rețelele neuronale sau autoregresia. Și am decis să mergem în altă direcție și să folosim metode simple, înțelegând că fiecare produs are multe caracteristici proprii. Există multe modele, dar nu se știe care model va fi cel mai bun pentru fiecare produs. Mai mult, am presupus chiar că un produs își schimbă modelul din când în când și poate fi mai bine prezis de un model la început, iar apoi, la un moment dat, un alt model va începe să funcționeze mai bine. Prin urmare, am realizat o compoziție adaptivă a unor modele adaptive simple. În fiecare moment, selectăm modelul care a funcționat mai bine recent, având în vedere previziuni mai precise, trecem la el, iar acest model este cel care oferă prognozele. Prima decizie care a fost luată a fost folosirea compoziției modele simple, în loc să construim ceva mai complex.

A doua soluție a fost că ne-am dat seama că funcționalitatea nu era standard și, așa cum am predat în primul an de fizică și tehnologie, am luat această funcțională, am diferențiat-o în funcție de parametrii modelului, am echivalat derivatele la zero și am obținut un anumit sistem de ecuații din care am derivat o nouă metodă. În principiu, aceasta este o meserie pentru un matematician pentru o seară, dar am ghicit că concurenții noștri nu ar face asta, pentru că au soluții gata făcute și cred cu tărie în ele. După cum sa dovedit, am luat cu adevărat decizia corectă.

O altă caracteristică a acestei probleme este că au existat intervale mari de lipsă non-aleatorie a cererii. Imaginați-vă: un produs este vândut constant în fiecare zi și dintr-o dată vezi că timp de două săptămâni acest produs nu este deloc disponibil. Acest lucru, desigur, nu se datorează faptului că nu există cerere, ci faptului că mărfurile pur și simplu nu au fost livrate, nu erau pe rafturi, nu erau în depozit. Pur și simplu tăiem astfel de intervale fără cerere din datele de antrenament, astfel încât să nu afecteze rezultatul.

A venit ziua în care am arătat soluția noastră organizatorilor competiției. Știam că unul dintre principalii noștri concurenți vorbea în fața noastră, iar când organizatorii ne-au întrebat: „Câte ore calculează modelul tău?”, am fost surprinși și am spus: „Nu ai înțeles că eram doar pe laptopul meu în un minut?” și opt secunde nu numai că au calculat toate previziunile, ci și au antrenat modelul nostru pe un interval de doi ani?” A fost, desigur, un șoc. Drept urmare, modelul nostru s-a dovedit a fi nu numai cel mai precis, ci și cel mai rapid. Am arătat că toate prognozele din întreaga rețea pot fi citite în literalmente două ore, noaptea, pe un server vechi și că nici măcar nu trebuie să achiziționați echipamente noi.

Aceasta nu este doar o poveste de succes, ci și o poveste foarte instructivă: în primul rând, nu vă fie teamă să folosiți metode non-standardși dacă problema este pusă într-un mod non-standard, atunci numai un matematician poate găsi rapid o soluție - este bine când se rezolvă rapid, uneori nu funcționează, desigur; în al doilea rând, acest incident ne-a dat puterea de a intra pe piață cu propriile soluții – nu trebuie să ne temem că există concurenți puternici pe piață. A mai fost un moment de predat. Când eu însumi selectam modele pentru această sarcină, am introdus mai întâi până la treizeci diferite modele, iar dintre ei, la fel de adaptativ cum spuneam, zi de zi a fost selectat modelul optim pentru fiecare produs.

În principiu, acest lucru este plin de un fenomen precum supraadaptarea, adică am putea să potrivim bine și cu precizie datele de antrenament și să prezicem prost pe noile date de testare. Știam despre acest fenomen că fenomenul se datorează faptului că modelul poate fi excesiv de complex, atunci apare efectul de supraadaptare. Mi s-a părut că a alege dintre treizeci de modele nu este atât de dificil; aici nu ar trebui să existe recalificare. Surpriza mea a fost foarte puternică când am făcut un experiment, am comparat antrenamentul cu controlul și am realizat că supraantrenamentul este pur și simplu uriaș și pierdem zeci de procente de precizie din cauza acestui efect. Doar aveam să introduc din ce în ce mai multe modele noi, dar acest experiment a arătat că soluția trebuie, dimpotrivă, simplificată și treizeci de modele sunt multe. Următorul șoc pentru mine a fost când s-a dovedit că numărul optim de modele era șase, adică era imposibil să construiesc o soluție mai complexă decât din șase modele.

Apoi, pur teoretic, această problemă m-a nedumerit, iar o soluție a fost găsită abia atunci când lucram la teza de doctorat și studiasem deja cu seriozitate fenomenul supraajustării în cadrul teoriei combinatorii a supraajustării. S-a dovedit că dacă alegi dintre modele și ai un model bun, iar toate celelalte sunt rele, atunci, de regulă, vei alege acest model bun. Nu vei fi recalificat, vei avea un singur lucru buna decizie. Dacă aveți multe modele, dar sunt asemănătoare între ele, nici nu vă veți supraadapta, deoarece complexitatea efectivă a populației de astfel de modele similare este scăzută, iar supraadaptarea este, de asemenea, scăzută. Și dacă se dovedește că modelele dvs. sunt semnificativ diferite și aproximativ toate sunt la fel de proaste, atunci supraadaptarea poate fi foarte mare, iar efectul supraajustării crește monstruos pe măsură ce crește numărul de modele. Exact aceasta a fost situația pe care am întâlnit-o la această licitație. Dar a fost posibil să o explicăm teoretic doar câțiva ani mai târziu.

A mai existat o poveste de avertizare. Apoi, la această licitație, prezentând soluția noastră organizatorilor competiției, le-am explicat: „Noi credem că funcționalitatea dumneavoastră nu este proiectată corect, nu puteți face acest lucru. Faptul că valoarea prezisă este la numitor nu este, desigur, bine. Faptul că funcționalul tău exprimă pătratul diferenței de eroare...” Care este pătratul rublelor, de exemplu? Acest lucru nu are sens economic. Ne-am propus să optimizăm funcționalitățile care exprimă pierderile companiei din previziuni inexacte și am arătat cum ar trebui structurată o astfel de funcționalitate și am arătat că suntem gata să optimizăm astfel de funcționalități non-standard, crescând astfel profitul companiei - exact ceea ce era necesar pentru afaceri. Când am început efectiv să lucrăm la proiect, sa dovedit că compania avea date foarte murdare care erau necesare pentru a construi o astfel de funcționalitate. Pentru unele produse, astfel de date nu erau deloc disponibile; pentru unele produse, aceste date erau inexacte, deoarece managerii încă nu erau interesați să verifice și să controleze astfel de date. Aceasta nu este contabilitate, este un fel de informații auxiliare. Poate cineva va avea nevoie de el într-o zi, poate nu.

Ca rezultat, s-a dovedit că datele erau murdare și a fost necesar să se îmbunătățească procesele de afaceri și să lucreze pentru îmbunătățirea calității datelor. Acesta este un lucru pe care afacerile nu l-au înțeles în acel moment. Când am venit cu soluția noastră și am realizat că lupta pentru calitatea și puritatea datelor este o parte importantă a afacerii, am ajutat și partenerii noștri să realizeze acest lucru și să îmbunătățească unele lucruri în cadrul proceselor lor de afaceri. O poveste atât de instructivă despre legătura dintre afaceri și știință, încât știința poate oferi afacerilor soluții non-standard. Uneori acest lucru nu este deloc dificil, dar dimpotrivă, în procesul de căutare a acestor soluții bazate pe cazuri reale, putem obține feedback pentru știință, putem întâlni câteva întrebări teoretice nerezolvate și putem avansa teoria.

Doctor în Științe Fizice și Matematice, Profesor, Facultatea de Informatică, Universitatea Națională de Cercetare, Școala Superioară de Economie