Παραδείγματα μεθόδου ελαχίστων τετραγώνων επίλυσης προβλημάτων. Μαθηματικά στα δάχτυλά σας: μέθοδοι ελαχίστων τετραγώνων Βρείτε τη συνάρτηση κατά προσέγγιση χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων

(βλέπε εικόνα). Πρέπει να βρείτε την εξίσωση μιας γραμμής

Όσο μικρότερος είναι ο αριθμός σε απόλυτη τιμή, τόσο καλύτερη είναι η επιλεγμένη ευθεία (2). Ως χαρακτηριστικό της ακρίβειας επιλογής μιας ευθείας γραμμής (2), μπορούμε να πάρουμε το άθροισμα των τετραγώνων

Οι ελάχιστες προϋποθέσεις για το S θα είναι

(6)
(7)

Οι εξισώσεις (6) και (7) μπορούν να γραφτούν ως εξής:

(8)
(9)

Από τις εξισώσεις (8) και (9) είναι εύκολο να βρούμε τα a και b από τις πειραματικές τιμές των xi και y i. Η ευθεία (2), που ορίζεται από τις εξισώσεις (8) και (9), ονομάζεται ευθεία που προκύπτει με τη μέθοδο των ελαχίστων τετραγώνων (αυτό το όνομα τονίζει ότι το άθροισμα των τετραγώνων S έχει ελάχιστο). Οι εξισώσεις (8) και (9), από τις οποίες καθορίζεται η ευθεία (2), ονομάζονται κανονικές εξισώσεις.

Μπορείτε να υποδείξετε έναν απλό και γενικό τρόπο σύνθεσης κανονικών εξισώσεων. Χρησιμοποιώντας τα πειραματικά σημεία (1) και την εξίσωση (2), μπορούμε να γράψουμε ένα σύστημα εξισώσεων για τα a και b

y 1 =ax 1 +b,
y 2 = τσεκούρι 2 + β,
...
(10)
y n = ax n + b,

Ας πολλαπλασιάσουμε την αριστερή και τη δεξιά πλευρά καθεμιάς από αυτές τις εξισώσεις με τον συντελεστή του πρώτου αγνώστου a (δηλαδή με x 1, x 2, ..., x n) και ας προσθέσουμε τις εξισώσεις που προκύπτουν, καταλήγοντας στην πρώτη κανονική εξίσωση (8) .

Ας πολλαπλασιάσουμε την αριστερή και τη δεξιά πλευρά καθεμιάς από αυτές τις εξισώσεις με τον συντελεστή του δεύτερου αγνώστου b, δηλ. κατά 1, και προσθέστε τις εξισώσεις που προκύπτουν, το αποτέλεσμα είναι η δεύτερη κανονική εξίσωση (9).

Αυτή η μέθοδος λήψης κανονικών εξισώσεων είναι γενική: είναι κατάλληλη, για παράδειγμα, για τη συνάρτηση

υπάρχει σταθερή τιμή και πρέπει να προσδιορίζεται από πειραματικά δεδομένα (1).

Το σύστημα εξισώσεων για το k μπορεί να γραφτεί:

Βρείτε την ευθεία γραμμή (2) χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Λύση.Βρίσκουμε:

x i =21, y i =46,3, x i 2 =91, x i y i =179,1.

Γράφουμε τις εξισώσεις (8) και (9)

Από εδώ βρίσκουμε

Εκτίμηση της ακρίβειας της μεθόδου των ελαχίστων τετραγώνων

Ας δώσουμε μια εκτίμηση της ακρίβειας της μεθόδου για τη γραμμική περίπτωση όταν ισχύει η εξίσωση (2).

Ας είναι ακριβείς οι πειραματικές τιμές x i και οι πειραματικές τιμές y i έχουν τυχαία σφάλματα με την ίδια διακύμανση για όλα τα i.

Ας εισάγουμε τη σημειογραφία

(16)

Τότε οι λύσεις των εξισώσεων (8) και (9) μπορούν να παρασταθούν με τη μορφή

(17)
(18)
Οπου
(19)
Από την εξίσωση (17) βρίσκουμε
(20)
Ομοίως, από την εξίσωση (18) προκύπτει

(21)
επειδή
(22)
Από τις εξισώσεις (21) και (22) βρίσκουμε
(23)

Οι εξισώσεις (20) και (23) παρέχουν μια εκτίμηση της ακρίβειας των συντελεστών που προσδιορίζονται από τις εξισώσεις (8) και (9).

Σημειώστε ότι οι συντελεστές a και b συσχετίζονται. Με απλούς μετασχηματισμούς βρίσκουμε τη στιγμή συσχέτισης τους.

Από εδώ βρίσκουμε

0,072 σε x=1 και 6,

0,041 σε x=3,5.

Βιβλιογραφία

Ακτή. Ya. B. Στατιστικές μέθοδοι ανάλυσης και έλεγχος ποιότητας και αξιοπιστίας. Μ.: Gosenergoizdat, 1962, σελ. 552, σσ. 92-98.

Αυτό το βιβλίο προορίζεται για ένα ευρύ φάσμα μηχανικών (ινστιτούτα ερευνών, γραφεία σχεδιασμού, εγκαταστάσεις δοκιμών και εργοστάσια) που εμπλέκονται στον προσδιορισμό της ποιότητας και της αξιοπιστίας του ηλεκτρονικού εξοπλισμού και άλλων μαζικών βιομηχανικών προϊόντων (μηχανολογία, κατασκευή οργάνων, πυροβολικό κ.λπ.).

Το βιβλίο παρέχει μια εφαρμογή μεθόδων μαθηματικών στατιστικών στην επεξεργασία και αξιολόγηση των αποτελεσμάτων των δοκιμών, στην οποία προσδιορίζεται η ποιότητα και η αξιοπιστία των ελεγχόμενων προϊόντων. Για τη διευκόλυνση των αναγνωστών παρέχονται οι απαραίτητες πληροφορίες από μαθηματικά στατιστικά στοιχεία, καθώς και μεγάλος αριθμός βοηθητικών μαθηματικών πινάκων που διευκολύνουν τους απαραίτητους υπολογισμούς.

Η παρουσίαση απεικονίζεται από μεγάλο αριθμό παραδειγμάτων από τον τομέα της ραδιοηλεκτρονικής και της τεχνολογίας πυροβολικού.

Ας προσεγγίσουμε τη συνάρτηση με ένα πολυώνυμο βαθμού 2. Για να γίνει αυτό, υπολογίζουμε τους συντελεστές του κανονικού συστήματος εξισώσεων:

, ,

Ας δημιουργήσουμε ένα κανονικό σύστημα ελαχίστων τετραγώνων, το οποίο έχει τη μορφή:

Η λύση στο σύστημα είναι εύκολο να βρεθεί:, , .

Βρίσκεται λοιπόν πολυώνυμο 2ου βαθμού: .

Θεωρητικές πληροφορίες

Επιστροφή στη σελίδα<Введение в вычислительную математику. Примеры>

Παράδειγμα 2. Εύρεση του βέλτιστου βαθμού ενός πολυωνύμου.

Επιστροφή στη σελίδα<Введение в вычислительную математику. Примеры>

Παράδειγμα 3. Παραγωγή κανονικού συστήματος εξισώσεων για την εύρεση των παραμέτρων της εμπειρικής εξάρτησης.

Ας εξαγάγουμε ένα σύστημα εξισώσεων για τον προσδιορισμό των συντελεστών και των συναρτήσεων , που πραγματοποιεί την προσέγγιση ρίζας-μέσου τετραγώνου μιας δεδομένης συνάρτησης ανά σημεία. Ας συνθέσουμε μια συνάρτηση και σημειώστε την απαραίτητη ακραία συνθήκη για αυτό:

Τότε το κανονικό σύστημα θα πάρει τη μορφή:

Αποκτήσαμε ένα γραμμικό σύστημα εξισώσεων για άγνωστες παραμέτρους και, το οποίο λύνεται εύκολα.

Θεωρητικές πληροφορίες

Επιστροφή στη σελίδα<Введение в вычислительную математику. Примеры>

Παράδειγμα.

Πειραματικά δεδομένα για τις τιμές των μεταβλητών ΧΚαι στοδίνονται στον πίνακα.

Ως αποτέλεσμα της ευθυγράμμισής τους, προκύπτει η συνάρτηση

Χρησιμοποιώντας μέθοδος ελάχιστου τετραγώνου, προσεγγίστε αυτά τα δεδομένα με μια γραμμική εξάρτηση y=ax+b(βρες παραμέτρους ΕΝΑΚαι σι). Μάθετε ποια από τις δύο γραμμές (με την έννοια της μεθόδου των ελαχίστων τετραγώνων) ευθυγραμμίζει καλύτερα τα πειραματικά δεδομένα. Κάντε ένα σχέδιο.

Η ουσία της μεθόδου των ελαχίστων τετραγώνων (LSM).

Το καθήκον είναι να βρεθούν οι γραμμικοί συντελεστές εξάρτησης στους οποίους η συνάρτηση δύο μεταβλητών ΕΝΑΚαι σιπαίρνει τη μικρότερη τιμή. Δοσμένο δηλαδή ΕΝΑΚαι σιτο άθροισμα των τετραγωνικών αποκλίσεων των πειραματικών δεδομένων από την ευθεία που βρέθηκε θα είναι το μικρότερο. Αυτό είναι το όλο νόημα της μεθόδου των ελαχίστων τετραγώνων.

Έτσι, η επίλυση του παραδείγματος καταλήγει στην εύρεση του άκρου μιας συνάρτησης δύο μεταβλητών.

Εξαγωγή τύπων εύρεσης συντελεστών.

Καταρτίζεται και λύνεται ένα σύστημα δύο εξισώσεων με δύο αγνώστους. Εύρεση των μερικών παραγώγων μιας συνάρτησης κατά μεταβλητές ΕΝΑΚαι σι, εξισώνουμε αυτές τις παραγώγους με μηδέν.

Επιλύουμε το προκύπτον σύστημα εξισώσεων χρησιμοποιώντας οποιαδήποτε μέθοδο (για παράδειγμα με μέθοδο αντικατάστασηςή τη μέθοδο Cramer) και λάβετε τύπους για την εύρεση συντελεστών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων (LSM).

Δεδομένος ΕΝΑΚαι σιλειτουργία παίρνει τη μικρότερη τιμή. Η απόδειξη αυτού του γεγονότος δίνεται παρακάτω στο κείμενο στο τέλος της σελίδας.

Αυτή είναι η όλη μέθοδος των ελαχίστων τετραγώνων. Τύπος για την εύρεση της παραμέτρου έναπεριέχει τα αθροίσματα , , και την παράμετρο n— ποσότητα πειραματικών δεδομένων. Συνιστούμε τον υπολογισμό των τιμών αυτών των ποσών χωριστά.

Συντελεστής σιβρέθηκε μετά τον υπολογισμό ένα.

Ήρθε η ώρα να θυμηθούμε το αρχικό παράδειγμα.

Λύση.

Στο παράδειγμά μας n=5. Συμπληρώνουμε τον πίνακα για ευκολία στον υπολογισμό των ποσών που περιλαμβάνονται στους τύπους των απαιτούμενων συντελεστών.

Οι τιμές στην τέταρτη σειρά του πίνακα λαμβάνονται πολλαπλασιάζοντας τις τιμές της 2ης σειράς με τις τιμές της 3ης σειράς για κάθε αριθμό Εγώ.

Οι τιμές στην πέμπτη σειρά του πίνακα λαμβάνονται με τον τετραγωνισμό των τιμών στη 2η σειρά για κάθε αριθμό Εγώ.

Οι τιμές στην τελευταία στήλη του πίνακα είναι τα αθροίσματα των τιμών στις σειρές.

Χρησιμοποιούμε τους τύπους της μεθόδου των ελαχίστων τετραγώνων για να βρούμε τους συντελεστές ΕΝΑΚαι σι. Αντικαθιστούμε τις αντίστοιχες τιμές από την τελευταία στήλη του πίνακα σε αυτές:

Ως εκ τούτου, y = 0,165x+2,184— την επιθυμητή κατά προσέγγιση ευθεία γραμμή.

Μένει να μάθουμε ποια από τις γραμμές y = 0,165x+2,184ή προσεγγίζει καλύτερα τα αρχικά δεδομένα, δηλαδή κάνει μια εκτίμηση χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Εκτίμηση σφάλματος της μεθόδου των ελαχίστων τετραγώνων.

Για να γίνει αυτό, πρέπει να υπολογίσετε το άθροισμα των τετραγωνικών αποκλίσεων των αρχικών δεδομένων από αυτές τις γραμμές Και , μια μικρότερη τιμή αντιστοιχεί σε μια γραμμή που προσεγγίζει καλύτερα τα αρχικά δεδομένα με την έννοια της μεθόδου των ελαχίστων τετραγώνων.

Από τότε κατευθείαν y = 0,165x+2,184προσεγγίζει καλύτερα τα αρχικά δεδομένα.

Γραφική απεικόνιση της μεθόδου των ελαχίστων τετραγώνων (LS).

Τα πάντα είναι ορατά στα γραφήματα. Η κόκκινη γραμμή είναι η ευθεία που βρέθηκε y = 0,165x+2,184, η μπλε γραμμή είναι , οι ροζ κουκκίδες είναι τα αρχικά δεδομένα.

Γιατί χρειάζεται αυτό, γιατί όλες αυτές οι προσεγγίσεις;

Προσωπικά το χρησιμοποιώ για την επίλυση προβλημάτων εξομάλυνσης δεδομένων, παρεμβολής και προβλημάτων παρέκτασης (στο αρχικό παράδειγμα μπορεί να τους ζητηθεί να βρουν την τιμή μιας παρατηρούμενης τιμής yστο x=3ή πότε x=6χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων). Αλλά θα μιλήσουμε περισσότερα για αυτό αργότερα σε άλλη ενότητα του ιστότοπου.

Αρχή σελίδας

Απόδειξη.

Έτσι όταν βρεθεί ΕΝΑΚαι σιη συνάρτηση παίρνει τη μικρότερη τιμή, είναι απαραίτητο σε αυτό το σημείο ο πίνακας της τετραγωνικής μορφής του διαφορικού δεύτερης τάξης για τη συνάρτηση ήταν θετική οριστική. Ας το δείξουμε.

Η διαφορά δεύτερης τάξης έχει τη μορφή:

Αυτό είναι

Επομένως, ο πίνακας της τετραγωνικής μορφής έχει τη μορφή

και οι τιμές των στοιχείων δεν εξαρτώνται από ΕΝΑΚαι σι.

Ας δείξουμε ότι ο πίνακας είναι θετικός ορισμένος. Για να γίνει αυτό, τα γωνιακά ανήλικα πρέπει να είναι θετικά.

Γωνιακό μινόρε πρώτης τάξης . Η ανισότητα είναι αυστηρή γιατί τα σημεία δεν συμπίπτουν. Σε όσα ακολουθούν θα το υπονοήσουμε αυτό.

Γωνιακό ελάσσονα δεύτερης τάξης

Ας το αποδείξουμε με τη μέθοδο της μαθηματικής επαγωγής.

συμπέρασμα: βρέθηκαν τιμές ΕΝΑΚαι σιαντιστοιχούν στη μικρότερη τιμή της συνάρτησης , επομένως, είναι οι απαιτούμενες παράμετροι για τη μέθοδο των ελαχίστων τετραγώνων.

Δεν υπάρχει χρόνος να το καταλάβω;
Παραγγείλετε μια λύση

Αρχή σελίδας

Ανάπτυξη πρόβλεψης με τη μέθοδο των ελαχίστων τετραγώνων. Παράδειγμα λύσης προβλήματος

Παρέκταση είναι μια μέθοδος επιστημονικής έρευνας που βασίζεται στη διάδοση τάσεων, προτύπων και συνδέσεων του παρελθόντος και του παρόντος με τη μελλοντική ανάπτυξη του αντικειμένου πρόβλεψης. Οι μέθοδοι παρέκτασης περιλαμβάνουν Μέθοδος κινούμενου μέσου όρου, μέθοδος εκθετικής εξομάλυνσης, μέθοδος ελαχίστων τετραγώνων.

Ουσία μέθοδος ελαχίστων τετραγώνων συνίσταται στην ελαχιστοποίηση του αθροίσματος των τετραγωνικών αποκλίσεων μεταξύ των παρατηρούμενων και των υπολογισμένων τιμών. Οι υπολογισμένες τιμές βρίσκονται χρησιμοποιώντας την επιλεγμένη εξίσωση - την εξίσωση παλινδρόμησης. Όσο μικρότερη είναι η απόσταση μεταξύ των πραγματικών τιμών και των υπολογισμένων, τόσο πιο ακριβής είναι η πρόβλεψη με βάση την εξίσωση παλινδρόμησης.

Μια θεωρητική ανάλυση της ουσίας του φαινομένου που μελετάται, η αλλαγή στο οποίο αντανακλάται από μια χρονοσειρά, χρησιμεύει ως βάση για την επιλογή μιας καμπύλης. Μερικές φορές λαμβάνονται υπόψη σκέψεις σχετικά με τη φύση της αύξησης των επιπέδων της σειράς. Έτσι, εάν αναμένεται αύξηση της παραγωγής με αριθμητική πρόοδο, τότε η εξομάλυνση εκτελείται σε ευθεία γραμμή. Εάν αποδειχθεί ότι η ανάπτυξη είναι σε γεωμετρική πρόοδο, τότε η εξομάλυνση πρέπει να γίνει χρησιμοποιώντας μια εκθετική συνάρτηση.

Τύπος εργασίας για τη μέθοδο των ελαχίστων τετραγώνων : Y t+1 = a*X + b, όπου t + 1 – περίοδος πρόβλεψης. Уt+1 – προβλεπόμενος δείκτης. Τα α και β είναι συντελεστές. Το Χ είναι σύμβολο του χρόνου.

Ο υπολογισμός των συντελεστών a και b πραγματοποιείται χρησιμοποιώντας τους ακόλουθους τύπους:

όπου, Uf – πραγματικές τιμές της σειράς δυναμικής. n – αριθμός επιπέδων χρονοσειρών.

Η εξομάλυνση χρονοσειρών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων χρησιμεύει για να αντικατοπτρίζει το πρότυπο ανάπτυξης του φαινομένου που μελετάται. Στην αναλυτική έκφραση μιας τάσης, ο χρόνος θεωρείται ως ανεξάρτητη μεταβλητή και τα επίπεδα της σειράς ενεργούν ως συνάρτηση αυτής της ανεξάρτητης μεταβλητής.

Η εξέλιξη ενός φαινομένου δεν εξαρτάται από το πόσα χρόνια έχουν περάσει από την αφετηρία, αλλά από το ποιοι παράγοντες επηρέασαν την εξέλιξή του, προς ποια κατεύθυνση και με ποια ένταση. Από εδώ είναι σαφές ότι η εξέλιξη ενός φαινομένου με την πάροδο του χρόνου είναι αποτέλεσμα της δράσης αυτών των παραγόντων.

Ο σωστός καθορισμός του τύπου της καμπύλης, ο τύπος της αναλυτικής εξάρτησης από το χρόνο είναι ένα από τα πιο δύσκολα καθήκοντα της προγνωστικής ανάλυσης .

Η επιλογή του τύπου της συνάρτησης που περιγράφει την τάση, οι παράμετροι της οποίας καθορίζονται με τη μέθοδο των ελαχίστων τετραγώνων, πραγματοποιείται στις περισσότερες περιπτώσεις εμπειρικά, με την κατασκευή ενός αριθμού συναρτήσεων και τη σύγκριση μεταξύ τους σύμφωνα με την τιμή του μέσο τετραγωνικό σφάλμα, που υπολογίζεται με τον τύπο:

όπου UV είναι οι πραγματικές τιμές της σειράς δυναμικής. Ur – υπολογισμένες (εξομαλυνόμενες) τιμές της σειράς δυναμικής. n – αριθμός επιπέδων χρονοσειρών. p – ο αριθμός των παραμέτρων που ορίζονται σε τύπους που περιγράφουν την τάση (τάση ανάπτυξης).

Μειονεκτήματα της μεθόδου των ελαχίστων τετραγώνων :

  • Όταν προσπαθείτε να περιγράψετε το οικονομικό φαινόμενο που μελετάται χρησιμοποιώντας μια μαθηματική εξίσωση, η πρόβλεψη θα είναι ακριβής για ένα σύντομο χρονικό διάστημα και η εξίσωση παλινδρόμησης θα πρέπει να υπολογιστεί εκ νέου καθώς γίνονται διαθέσιμες νέες πληροφορίες.
  • την πολυπλοκότητα της επιλογής μιας εξίσωσης παλινδρόμησης που είναι επιλύσιμη χρησιμοποιώντας τυπικά προγράμματα υπολογιστή.

Ένα παράδειγμα χρήσης της μεθόδου των ελαχίστων τετραγώνων για την ανάπτυξη μιας πρόβλεψης

Εργο . Υπάρχουν στοιχεία που χαρακτηρίζουν το ποσοστό ανεργίας στην περιοχή, %

  • Κατασκευάστε μια πρόβλεψη του ποσοστού ανεργίας στην περιοχή για τον Νοέμβριο, τον Δεκέμβριο, τον Ιανουάριο χρησιμοποιώντας τις ακόλουθες μεθόδους: κινούμενος μέσος όρος, εκθετική εξομάλυνση, ελάχιστα τετράγωνα.
  • Υπολογίστε τα σφάλματα στις προκύπτουσες προβλέψεις χρησιμοποιώντας κάθε μέθοδο.
  • Συγκρίνετε τα αποτελέσματα και βγάλτε συμπεράσματα.

Λύση ελαχίστων τετραγώνων

Για να το λύσουμε αυτό, θα συντάξουμε έναν πίνακα στον οποίο θα κάνουμε τους απαραίτητους υπολογισμούς:

ε = 28,63/10 = 2,86% ακρίβεια πρόβλεψηςυψηλός.

συμπέρασμα : Σύγκριση των αποτελεσμάτων που προέκυψαν από τους υπολογισμούς μέθοδος κινούμενου μέσου όρου , μέθοδος εκθετικής εξομάλυνσης και τη μέθοδο των ελαχίστων τετραγώνων, μπορούμε να πούμε ότι το μέσο σχετικό σφάλμα κατά τον υπολογισμό με τη μέθοδο της εκθετικής εξομάλυνσης εμπίπτει στο εύρος του 20-50%. Αυτό σημαίνει ότι η ακρίβεια της πρόβλεψης σε αυτή την περίπτωση είναι μόνο ικανοποιητική.

Στην πρώτη και στην τρίτη περίπτωση, η ακρίβεια πρόβλεψης είναι υψηλή, αφού το μέσο σχετικό σφάλμα είναι μικρότερο από 10%. Αλλά η μέθοδος του κινούμενου μέσου όρου κατέστησε δυνατή την απόκτηση πιο αξιόπιστων αποτελεσμάτων (πρόβλεψη Νοεμβρίου - 1,52%, πρόβλεψη Δεκεμβρίου - 1,53%, πρόβλεψη Ιανουαρίου - 1,49%), καθώς το μέσο σχετικό σφάλμα κατά τη χρήση αυτής της μεθόδου είναι το μικρότερο - 1 ,13%.

Μέθοδος ελάχιστου τετραγώνου

Άλλα άρθρα σχετικά με αυτό το θέμα:

Κατάλογος πηγών που χρησιμοποιήθηκαν

  1. Επιστημονικές και μεθοδολογικές συστάσεις για τη διάγνωση κοινωνικών κινδύνων και την πρόβλεψη προκλήσεων, απειλών και κοινωνικών συνεπειών. Ρωσικό Κρατικό Κοινωνικό Πανεπιστήμιο. Μόσχα. 2010;
  2. Vladimirova L.P. Πρόβλεψη και προγραμματισμός σε συνθήκες αγοράς: Σχολικό βιβλίο. επίδομα. Μ.: Εκδοτικός Οίκος "Dashkov and Co", 2001;
  3. Novikova N.V., Pozdeeva O.G. Πρόβλεψη της εθνικής οικονομίας: Εκπαιδευτικό και μεθοδολογικό εγχειρίδιο. Ekaterinburg: Ural Publishing House. κατάσταση οικον. Univ., 2007;
  4. Slutskin L.N. Μάθημα MBA για επιχειρηματικές προβλέψεις. Μ.: Alpina Business Books, 2006.

Πρόγραμμα MNC

Εισαγάγετε δεδομένα

Δεδομένα και προσέγγιση y = a + b x

Εγώ- αριθμός πειραματικών σημείων.
x i- τιμή μιας σταθερής παραμέτρου σε ένα σημείο Εγώ;
y i- τιμή της μετρούμενης παραμέτρου σε ένα σημείο Εγώ;
ω i- μέτρηση βάρους σε ένα σημείο Εγώ;
y i, υπολογ.- διαφορά μεταξύ μετρούμενης και υπολογιζόμενης τιμής παλινδρόμησης yστο σημείο Εγώ;
S x i (x i)- εκτίμηση σφάλματος x iκατά τη μέτρηση yστο σημείο Εγώ.

Δεδομένα και προσέγγιση y = k x

Εγώ x i y i ω i y i, υπολογ. Δy i S x i (x i)

Κάντε κλικ στο γράφημα

Εγχειρίδιο χρήστη για το διαδικτυακό πρόγραμμα MNC.

Στο πεδίο δεδομένων, εισαγάγετε σε κάθε ξεχωριστή γραμμή τις τιμές των «x» και «y» σε ένα πειραματικό σημείο. Οι τιμές πρέπει να διαχωρίζονται με έναν χαρακτήρα κενού διαστήματος (κενό ή καρτέλα).

Η τρίτη τιμή θα μπορούσε να είναι το βάρος του σημείου «w». Αν το βάρος ενός σημείου δεν προσδιορίζεται, είναι ίσο με ένα. Στη συντριπτική πλειοψηφία των περιπτώσεων, τα βάρη των πειραματικών σημείων είναι άγνωστα ή δεν υπολογίζονται, δηλ. όλα τα πειραματικά δεδομένα θεωρούνται ισοδύναμα. Μερικές φορές τα βάρη στο μελετημένο εύρος τιμών δεν είναι απολύτως ισοδύναμα και μπορούν ακόμη και να υπολογιστούν θεωρητικά. Για παράδειγμα, στη φασματοφωτομετρία, τα βάρη μπορούν να υπολογιστούν χρησιμοποιώντας απλούς τύπους, αν και αυτό συνήθως παραμελείται για τη μείωση του κόστους εργασίας.

Τα δεδομένα μπορούν να επικολληθούν μέσω του πρόχειρου από ένα υπολογιστικό φύλλο σε μια σουίτα γραφείου όπως το Excel από το Microsoft Office ή το Calc από το Open Office. Για να το κάνετε αυτό, στο υπολογιστικό φύλλο, επιλέξτε το εύρος των δεδομένων προς αντιγραφή, αντιγράψτε στο πρόχειρο και επικολλήστε τα δεδομένα στο πεδίο δεδομένων αυτής της σελίδας.

Για τον υπολογισμό με τη μέθοδο των ελαχίστων τετραγώνων, χρειάζονται τουλάχιστον δύο σημεία για τον προσδιορισμό δύο συντελεστών «b» - την εφαπτομένη της γωνίας κλίσης της ευθείας και «a» - την τιμή που τέμνεται από την ευθεία στον άξονα «y».

Για να υπολογίσετε το σφάλμα των υπολογισμένων συντελεστών παλινδρόμησης, πρέπει να ορίσετε τον αριθμό των πειραματικών σημείων σε περισσότερα από δύο.

Μέθοδος ελαχίστων τετραγώνων (LSM).

Όσο μεγαλύτερος είναι ο αριθμός των πειραματικών σημείων, τόσο πιο ακριβής είναι η στατιστική εκτίμηση των συντελεστών (λόγω μείωσης του συντελεστή Student) και τόσο πιο κοντά η εκτίμηση στην εκτίμηση του γενικού δείγματος.

Η απόκτηση τιμών σε κάθε πειραματικό σημείο συνδέεται συχνά με σημαντικό εργατικό κόστος, επομένως πραγματοποιείται συχνά ένας συμβιβαστικός αριθμός πειραμάτων που δίνει μια διαχειρίσιμη εκτίμηση και δεν οδηγεί σε υπερβολικό κόστος εργασίας. Κατά κανόνα, ο αριθμός των πειραματικών σημείων για μια εξάρτηση γραμμικών ελαχίστων τετραγώνων με δύο συντελεστές επιλέγεται στην περιοχή 5-7 σημείων.

Μια σύντομη θεωρία των ελάχιστων τετραγώνων για γραμμικές σχέσεις

Ας υποθέσουμε ότι έχουμε ένα σύνολο πειραματικών δεδομένων με τη μορφή ζευγών τιμών [`y_i`, `x_i`], όπου το "i" είναι ο αριθμός μιας πειραματικής μέτρησης από το 1 έως το "n". `y_i` - η τιμή της μετρούμενης ποσότητας στο σημείο `i`. `x_i` - η τιμή της παραμέτρου που ορίσαμε στο σημείο `i`.

Ως παράδειγμα, εξετάστε τη λειτουργία του νόμου του Ohm. Αλλάζοντας την τάση (διαφορά δυναμικού) μεταξύ των τμημάτων ενός ηλεκτρικού κυκλώματος, μετράμε την ποσότητα του ρεύματος που διέρχεται από αυτό το τμήμα. Η φυσική μας δίνει μια εξάρτηση που βρέθηκε πειραματικά:

«I = U/R»,
όπου «εγώ» είναι η τρέχουσα δύναμη. `R` - αντίσταση; `U` - τάση.

Σε αυτήν την περίπτωση, «y_i» είναι η τρέχουσα τιμή που μετράται και «x_i» είναι η τιμή τάσης.

Ως άλλο παράδειγμα, εξετάστε την απορρόφηση του φωτός από ένα διάλυμα μιας ουσίας σε διάλυμα. Η Χημεία μας δίνει τον τύπο:

«A = ε l C»,
όπου «A» είναι η οπτική πυκνότητα του διαλύματος. «ε» - διαπερατότητα της διαλυμένης ουσίας. `l` - μήκος διαδρομής όταν το φως διέρχεται από μια κυψελίδα με διάλυμα. «C» είναι η συγκέντρωση της διαλυμένης ουσίας.

Σε αυτήν την περίπτωση, «y_i» είναι η μετρούμενη τιμή της οπτικής πυκνότητας «A» και «x_i» είναι η τιμή συγκέντρωσης της ουσίας που καθορίζουμε.

Θα εξετάσουμε την περίπτωση όταν το σχετικό σφάλμα στην ανάθεση `x_i` είναι σημαντικά μικρότερο από το σχετικό σφάλμα στη μέτρηση `y_i`. Θα υποθέσουμε επίσης ότι όλες οι μετρούμενες τιμές `y_i` είναι τυχαίες και κανονικά κατανεμημένες, δηλ. υπακούουν στον νόμο της κανονικής κατανομής.

Στην περίπτωση μιας γραμμικής εξάρτησης του «y» από το «x», μπορούμε να γράψουμε τη θεωρητική εξάρτηση:
`y = a + b x`.

Από γεωμετρική άποψη, ο συντελεστής «b» υποδηλώνει την εφαπτομένη της γωνίας κλίσης της ευθείας στον άξονα «x» και ο συντελεστής «a» - την τιμή του «y» στο σημείο τομής του ευθεία με τον άξονα `y` (στο `x = 0`).

Εύρεση των παραμέτρων της γραμμής παλινδρόμησης.

Σε ένα πείραμα, οι μετρούμενες τιμές του «y_i» δεν μπορούν να βρίσκονται ακριβώς στη θεωρητική ευθεία γραμμή λόγω σφαλμάτων μέτρησης, τα οποία είναι πάντα εγγενή στην πραγματική ζωή. Επομένως, μια γραμμική εξίσωση πρέπει να αντιπροσωπεύεται από ένα σύστημα εξισώσεων:
`y_i = a + b x_i + ε_i` (1),
όπου «ε_i» είναι το άγνωστο σφάλμα μέτρησης του «y» στο «i»-ο πείραμα.

Η εξάρτηση (1) ονομάζεται επίσης οπισθοδρόμηση, δηλ. η εξάρτηση δύο ποσοτήτων μεταξύ τους με στατιστική σημασία.

Το καθήκον της αποκατάστασης της εξάρτησης είναι να βρεθούν οι συντελεστές `a` και `b` από τα πειραματικά σημεία [`y_i`, `x_i`].

Για την εύρεση των συντελεστών «a» και «b» χρησιμοποιείται συνήθως μέθοδος ελάχιστου τετραγώνου(MNC). Είναι μια ειδική περίπτωση της αρχής της μέγιστης πιθανότητας.

Ας ξαναγράψουμε το (1) με τη μορφή `ε_i = y_i - a - b x_i`.

Τότε το άθροισμα των τετραγωνικών σφαλμάτων θα είναι
`Φ = sum_(i=1)^(n) ε_i^2 = sum_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

Η αρχή των ελαχίστων τετραγώνων (ελάχιστων τετραγώνων) είναι η ελαχιστοποίηση του αθροίσματος (2) σε σχέση με τις παραμέτρους «a» και «b».

Το ελάχιστο επιτυγχάνεται όταν οι μερικές παράγωγοι του αθροίσματος (2) ως προς τους συντελεστές «a» και «b» είναι ίσες με μηδέν:
`frac(μερικό Φ)(μερικό a) = frac(μερικό άθροισμα_(i=1)^(n) (y_i - a - b x_i)^2)(μερικό a) = 0`
`frac(μερικό Φ)(μερικό b) = frac(μερικό άθροισμα_(i=1)^(n) (y_i - a - b x_i)^2)(μερικό b) = 0`

Επεκτείνοντας τις παραγώγους, λαμβάνουμε ένα σύστημα δύο εξισώσεων με δύο αγνώστους:
`sum_(i=1)^(n) (2a + 2bx_i — 2y_i) = sum_(i=1)^(n) (a + bx_i — y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i — 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i — x_iy_i) = 0`

Ανοίγουμε τις αγκύλες και μεταφέρουμε τα αθροίσματα ανεξάρτητα από τους απαιτούμενους συντελεστές στο άλλο μισό, παίρνουμε ένα σύστημα γραμμικών εξισώσεων:
`sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
`sum_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`

Λύνοντας το σύστημα που προκύπτει, βρίσκουμε τύπους για τους συντελεστές «a» και «b»:

`a = frac(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 — sum_(i=1)^(n) x_i sum_(i=1)^(n ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (άθροισμα_(i=1)^(n) x_i)^2)` (3.1)

`b = frac(n sum_(i=1)^(n) x_iy_i — sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (n) x_i^2 — (άθροισμα_(i=1)^(n) x_i)^2)` (3.2)

Αυτοί οι τύποι έχουν λύσεις όταν `n > 1` (η γραμμή μπορεί να κατασκευαστεί χρησιμοποιώντας τουλάχιστον 2 σημεία) και όταν η ορίζουσα `D = n sum_(i=1)^(n) x_i^2 - (sum_(i= 1 )^(n) x_i)^2 != 0`, δηλ. όταν τα σημεία `x_i` στο πείραμα είναι διαφορετικά (δηλαδή όταν η γραμμή δεν είναι κάθετη).

Εκτίμηση σφαλμάτων συντελεστών γραμμής παλινδρόμησης

Για μια πιο ακριβή εκτίμηση του σφάλματος στον υπολογισμό των συντελεστών «a» και «b», είναι επιθυμητός ένας μεγάλος αριθμός πειραματικών σημείων. Όταν `n = 2`, είναι αδύνατο να εκτιμηθεί το σφάλμα των συντελεστών, γιατί η κατά προσέγγιση γραμμή θα περάσει μοναδικά από δύο σημεία.

Προσδιορίζεται το σφάλμα της τυχαίας μεταβλητής `V` νόμος της συσσώρευσης λάθους
`S_V^2 = άθροισμα_(i=1)^p (frac(μερικό f)(μερικό z_i))^2 S_(z_i)^2`,
όπου "p" είναι ο αριθμός των παραμέτρων "z_i" με σφάλμα "S_(z_i)", οι οποίες επηρεάζουν το σφάλμα "S_V".
Το `f` είναι συνάρτηση της εξάρτησης του `V` από το `z_i`.

Ας γράψουμε τον νόμο της συσσώρευσης σφάλματος για το σφάλμα των συντελεστών «a» και «b»
`S_a^2 = sum_(i=1)^(n)(frac(μερικό a)(μερικό y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(μερικό a )(μερικό x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(μερικό α)(μερικό y_i))^2 `,
`S_b^2 = sum_(i=1)^(n)(frac(μερικό b)(μερικό y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(μερικό b )(μερικό x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(μερικό β)(μερικό y_i))^2 `,
επειδή `S_(x_i)^2 = 0` (προηγουμένως κάναμε κράτηση ότι το σφάλμα `x` είναι αμελητέο).

`S_y^2 = S_(y_i)^2` - σφάλμα (διακύμανση, τετραγωνισμένη τυπική απόκλιση) στη μέτρηση του `y`, με την προϋπόθεση ότι το σφάλμα είναι ομοιόμορφο για όλες τις τιμές του `y`.

Αντικαθιστώντας τους τύπους για τον υπολογισμό των «a» και «b» στις παραστάσεις που προκύπτουν

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 — x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i — sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 — (άθροισμα_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

Στα περισσότερα πραγματικά πειράματα, η τιμή του «Sy» δεν μετριέται. Για να γίνει αυτό, είναι απαραίτητο να πραγματοποιηθούν πολλές παράλληλες μετρήσεις (πειράματα) σε ένα ή περισσότερα σημεία του σχεδίου, γεγονός που αυξάνει τον χρόνο (και πιθανώς το κόστος) του πειράματος. Επομένως, συνήθως θεωρείται ότι η απόκλιση του «y» από τη γραμμή παλινδρόμησης μπορεί να θεωρηθεί τυχαία. Η εκτίμηση της διακύμανσης `y` σε αυτήν την περίπτωση υπολογίζεται χρησιμοποιώντας τον τύπο.

`S_y^2 = S_(y, υπόλοιπο)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

Ο διαιρέτης `n-2` εμφανίζεται επειδή ο αριθμός των βαθμών ελευθερίας μας έχει μειωθεί λόγω του υπολογισμού δύο συντελεστών χρησιμοποιώντας το ίδιο δείγμα πειραματικών δεδομένων.

Αυτή η εκτίμηση ονομάζεται επίσης υπολειπόμενη διακύμανση σε σχέση με τη γραμμή παλινδρόμησης `S_(y, υπόλοιπο)^2`.

Η σημασία των συντελεστών αξιολογείται χρησιμοποιώντας το Student’s t test

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

Εάν τα υπολογιζόμενα κριτήρια «t_a», «t_b» είναι λιγότερα από τα πινακοποιημένα κριτήρια «t(P, n-2)», τότε θεωρείται ότι ο αντίστοιχος συντελεστής δεν διαφέρει σημαντικά από το μηδέν με δεδομένη πιθανότητα «P».

Για να αξιολογήσετε την ποιότητα της περιγραφής μιας γραμμικής σχέσης, μπορείτε να συγκρίνετε τα "S_(y, rest)^2" και "S_(bar y)" σε σχέση με τον μέσο όρο χρησιμοποιώντας το κριτήριο Fisher.

`S_(bar y) = frac(sum_(i=1)^n (y_i — bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i — (sum_(i= 1)^n y_i) /n)^2) (n-1)` - εκτίμηση δείγματος της διακύμανσης `y` σε σχέση με τον μέσο όρο.

Για να εκτιμηθεί η αποτελεσματικότητα της εξίσωσης παλινδρόμησης για την περιγραφή της εξάρτησης, υπολογίζεται ο συντελεστής Fisher
`F = S_(γραμμή y) / S_(y, υπόλοιπο)^2`,
που συγκρίνεται με τον πίνακα Fisher συντελεστή «F(p, n-1, n-2)».

Εάν «F > F(P, n-1, n-2)», η διαφορά μεταξύ της περιγραφής της σχέσης `y = f(x)` με χρήση της εξίσωσης παλινδρόμησης και της περιγραφής που χρησιμοποιεί το μέσο όρο θεωρείται στατιστικά σημαντική με πιθανότητα «Π». Εκείνοι. Η παλινδρόμηση περιγράφει την εξάρτηση καλύτερα από την εξάπλωση του «y» γύρω από το μέσο όρο.

Κάντε κλικ στο γράφημα
για να προσθέσετε τιμές στον πίνακα

Μέθοδος ελάχιστου τετραγώνου. Η μέθοδος ελαχίστων τετραγώνων σημαίνει τον προσδιορισμό άγνωστων παραμέτρων a, b, c, την αποδεκτή συναρτησιακή εξάρτηση

Η μέθοδος των ελαχίστων τετραγώνων αναφέρεται στον προσδιορισμό άγνωστων παραμέτρων α, β, γ,…αποδεκτή λειτουργική εξάρτηση

y = f(x,a,b,c,…),

που θα παρείχε ένα ελάχιστο του μέσου τετραγώνου (διακύμανση) του σφάλματος

, (24)

όπου x i, y i είναι ένα σύνολο ζευγών αριθμών που λαμβάνονται από το πείραμα.

Εφόσον η συνθήκη για το άκρο μιας συνάρτησης πολλών μεταβλητών είναι η συνθήκη ότι οι μερικές παράγωγοί της είναι ίσες με μηδέν, τότε οι παράμετροι α, β, γ,…καθορίζονται από το σύστημα των εξισώσεων:

; ; ; … (25)

Πρέπει να θυμόμαστε ότι η μέθοδος των ελαχίστων τετραγώνων χρησιμοποιείται για την επιλογή παραμέτρων μετά τον τύπο της συνάρτησης y = f(x)ορίζεται

Εάν, από θεωρητικές σκέψεις, δεν μπορούν να εξαχθούν συμπεράσματα σχετικά με το ποιος πρέπει να είναι ο εμπειρικός τύπος, τότε πρέπει να καθοδηγηθεί από οπτικές αναπαραστάσεις, κυρίως από γραφικές αναπαραστάσεις των παρατηρούμενων δεδομένων.

Στην πράξη, τις περισσότερες φορές περιορίζονται στους ακόλουθους τύπους λειτουργιών:

1) γραμμικό ;

2) τετραγωνικός α.

Προσέγγιση, ή προσέγγιση- μια επιστημονική μέθοδος που συνίσταται στην αντικατάσταση ορισμένων αντικειμένων με άλλα, με τη μια ή την άλλη έννοια κοντά στα αρχικά, αλλά πιο απλά.

Η προσέγγιση σάς επιτρέπει να μελετήσετε τα αριθμητικά χαρακτηριστικά και τις ποιοτικές ιδιότητες ενός αντικειμένου, μειώνοντας το πρόβλημα στη μελέτη απλούστερων ή πιο βολικών αντικειμένων (για παράδειγμα, εκείνων των οποίων τα χαρακτηριστικά υπολογίζονται εύκολα ή των οποίων οι ιδιότητες είναι ήδη γνωστές). Στη θεωρία αριθμών μελετώνται οι Διοφαντικές προσεγγίσεις, ειδικότερα οι προσεγγίσεις παράλογων αριθμών από ορθολογικούς. Στη γεωμετρία, λαμβάνονται υπόψη οι προσεγγίσεις των καμπυλών με διακεκομμένες γραμμές. Ορισμένοι κλάδοι των μαθηματικών είναι ουσιαστικά εξ ολοκλήρου αφιερωμένοι στην προσέγγιση, για παράδειγμα, η θεωρία της προσέγγισης των συναρτήσεων, οι αριθμητικές μέθοδοι ανάλυσης.

Με μεταφορική έννοια χρησιμοποιείται στη φιλοσοφία ως μέθοδος προσέγγισης, ένδειξη κατά προσέγγιση, μη οριστικού χαρακτήρα. Για παράδειγμα, με αυτή την έννοια, ο όρος «προσέγγιση» χρησιμοποιήθηκε ενεργά από τον Søren Kierkegaard (1813-1855) στο «The Final Unscientific Afterword...»

Εάν η συνάρτηση χρησιμοποιείται μόνο για παρεμβολή, τότε αρκεί να προσεγγίσουμε τα σημεία με ένα πολυώνυμο, ας πούμε, πέμπτου βαθμού:

Η κατάσταση είναι πολύ πιο περίπλοκη εάν τα παραπάνω φυσικά δεδομένα χρησιμεύουν ως σημεία αναφοράς για τον προσδιορισμό του νόμου της αλλαγής με γνωστές οριακές συνθήκες. Για παράδειγμα: και . Εδώ η ποιότητα του αποτελέσματος εξαρτάται από τον επαγγελματισμό του ερευνητή. Στην περίπτωση αυτή, ο καταλληλότερος νόμος θα ήταν:

Για τη βέλτιστη επιλογή των παραμέτρων της εξίσωσης, χρησιμοποιείται συνήθως η μέθοδος των ελαχίστων τετραγώνων.

Μέθοδος ελαχίστων τετραγώνων (LSM,ΑγγλικάΣυνήθης Ελάχιστα Τετράγωνα , Ο Ο.Λ.Σ. ) - μια μαθηματική μέθοδος που χρησιμοποιείται για την επίλυση διαφόρων προβλημάτων, που βασίζεται στην ελαχιστοποίηση του αθροίσματος των τετραγώνων ορισμένων συναρτήσεων των επιθυμητών μεταβλητών. Μπορεί να χρησιμοποιηθεί για την «λύση» υπερκαθορισμένων συστημάτων εξισώσεων (όταν ο αριθμός των εξισώσεων υπερβαίνει τον αριθμό των αγνώστων), για την εύρεση λύσης στην περίπτωση συνηθισμένων (όχι υπερκαθορισμένων) μη γραμμικών συστημάτων εξισώσεων, για την προσέγγιση των σημειακών τιμών με κάποια λειτουργία. Το OLS είναι μία από τις βασικές μεθόδους ανάλυσης παλινδρόμησης για την εκτίμηση άγνωστων παραμέτρων μοντέλων παλινδρόμησης από δεδομένα δείγματος.

Εάν μια ορισμένη φυσική ποσότητα εξαρτάται από μια άλλη ποσότητα, τότε αυτή η εξάρτηση μπορεί να μελετηθεί μετρώντας το y σε διαφορετικές τιμές του x. Ως αποτέλεσμα των μετρήσεων, λαμβάνονται ορισμένες τιμές:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Με βάση τα δεδομένα ενός τέτοιου πειράματος, είναι δυνατό να κατασκευαστεί ένα γράφημα της εξάρτησης y = ƒ(x). Η καμπύλη που προκύπτει καθιστά δυνατή την κρίση της μορφής της συνάρτησης ƒ(x). Ωστόσο, οι σταθεροί συντελεστές που εισέρχονται σε αυτή τη συνάρτηση παραμένουν άγνωστοι. Μπορούν να προσδιοριστούν χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Τα πειραματικά σημεία, κατά κανόνα, δεν βρίσκονται ακριβώς στην καμπύλη. Η μέθοδος των ελαχίστων τετραγώνων απαιτεί το άθροισμα των τετραγώνων των αποκλίσεων των πειραματικών σημείων από την καμπύλη, δηλ. Το 2 ήταν το μικρότερο.

Στην πράξη, αυτή η μέθοδος χρησιμοποιείται πιο συχνά (και πιο απλά) στην περίπτωση μιας γραμμικής σχέσης, δηλ. Οταν

y = kxή y = a + bx.

Η γραμμική εξάρτηση είναι πολύ διαδεδομένη στη φυσική. Και ακόμη και όταν η σχέση είναι μη γραμμική, συνήθως προσπαθούν να κατασκευάσουν ένα γράφημα έτσι ώστε να πάρουν μια ευθεία γραμμή. Για παράδειγμα, αν υποτεθεί ότι ο δείκτης διάθλασης του γυαλιού n σχετίζεται με το μήκος κύματος φωτός λ με τη σχέση n = a + b/λ 2, τότε η εξάρτηση του n από το λ -2 απεικονίζεται στο γράφημα.

Σκεφτείτε την εξάρτηση y = kx(ευθεία γραμμή που διέρχεται από την αρχή). Ας συνθέσουμε την τιμή φ - το άθροισμα των τετραγώνων των αποκλίσεων των σημείων μας από την ευθεία

.

Η τιμή του φ είναι πάντα θετική και αποδεικνύεται μικρότερη όσο πιο κοντά είναι τα σημεία μας στην ευθεία. Η μέθοδος των ελαχίστων τετραγώνων δηλώνει ότι η τιμή για το k πρέπει να επιλεγεί έτσι ώστε το φ να έχει ένα ελάχιστο

ή (19)

Ο υπολογισμός δείχνει ότι το σφάλμα ρίζας μέσου τετραγώνου στον προσδιορισμό της τιμής του k είναι ίσο με

, (20) όπου n είναι ο αριθμός των μετρήσεων.

Ας εξετάσουμε τώρα μια λίγο πιο δύσκολη περίπτωση, όταν τα σημεία πρέπει να ικανοποιούν τον τύπο y = a + bx(ευθεία που δεν διέρχεται από την αρχή).

Το καθήκον είναι να βρείτε τις καλύτερες τιμές των a και b από το διαθέσιμο σύνολο τιμών x i, y i.

Ας συνθέσουμε πάλι τον τετραγωνικό τύπο φ, ίσο με το άθροισμα των τετραγωνικών αποκλίσεων των σημείων x i, y i από την ευθεία

και βρείτε τις τιμές των a και b για τις οποίες το φ έχει ελάχιστο

;

.

Η κοινή λύση αυτών των εξισώσεων δίνει

(21)

Τα ριζικά μέσα τετραγωνικά σφάλματα προσδιορισμού των a και b είναι ίσα

(23)

. (24)

Κατά την επεξεργασία των αποτελεσμάτων των μετρήσεων χρησιμοποιώντας αυτή τη μέθοδο, είναι βολικό να συνοψίζονται όλα τα δεδομένα σε έναν πίνακα στον οποίο έχουν υπολογιστεί προκαταρκτικά όλα τα ποσά που περιλαμβάνονται στους τύπους (19)–(24). Οι μορφές αυτών των πινάκων δίνονται στα παρακάτω παραδείγματα.

Παράδειγμα 1. Μελετήθηκε η βασική εξίσωση της δυναμικής της περιστροφικής κίνησης ε = M/J (ευθεία γραμμή που διέρχεται από την αρχή). Σε διαφορετικές τιμές της στιγμής M, μετρήθηκε η γωνιακή επιτάχυνση ε ενός συγκεκριμένου σώματος. Απαιτείται ο προσδιορισμός της ροπής αδράνειας αυτού του σώματος. Τα αποτελέσματα των μετρήσεων της ροπής δύναμης και της γωνιακής επιτάχυνσης παρατίθενται στη δεύτερη και τρίτη στήλη πίνακας 5.

Πίνακας 5

Χρησιμοποιώντας τον τύπο (19) προσδιορίζουμε:

.

Για να προσδιορίσουμε το ριζικό μέσο τετραγωνικό σφάλμα, χρησιμοποιούμε τον τύπο (20)

0.005775 κιλό-1 · Μ -2 .

Σύμφωνα με τον τύπο (18) έχουμε

S J = (2,996 0,005775)/0,3337 = 0,05185 kg m 2 .

Έχοντας ορίσει την αξιοπιστία P = 0,95, χρησιμοποιώντας τον πίνακα των συντελεστών Student για n = 5, βρίσκουμε t = 2,78 και προσδιορίζουμε το απόλυτο σφάλμα ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m 2 .

Ας γράψουμε τα αποτελέσματα στη μορφή:

J = (3,0 ± 0,2) kg m 2 ;

Παράδειγμα 2.Ας υπολογίσουμε τον συντελεστή θερμοκρασίας της μεταλλικής αντίστασης χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Η αντίσταση εξαρτάται γραμμικά από τη θερμοκρασία

Rt = R0 (1 + α t°) = R0 + R0 α t°.

Ο ελεύθερος όρος καθορίζει την αντίσταση R 0 σε θερμοκρασία 0 ° C και η κλίση είναι το γινόμενο του συντελεστή θερμοκρασίας α και της αντίστασης R 0 .

Τα αποτελέσματα των μετρήσεων και των υπολογισμών δίνονται στον πίνακα ( βλέπε πίνακα 6).

Πίνακας 6

(r - bt - a) 2 .10 -6

Χρησιμοποιώντας τους τύπους (21), (22) προσδιορίζουμε

R 0 = ¯R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ωμ .

Ας βρούμε ένα σφάλμα στον ορισμό του α. Αφού , τότε σύμφωνα με τον τύπο (18) έχουμε:

.

Χρησιμοποιώντας τους τύπους (23), (24) έχουμε

;

0.014126 Ωμ.

Έχοντας ορίσει την αξιοπιστία σε P = 0,95, χρησιμοποιώντας τον πίνακα των συντελεστών Student για n = 6, βρίσκουμε t = 2,57 και προσδιορίζουμε το απόλυτο σφάλμα Δα = 2,57 0,000132 = 0,000338 χαλάζι -1 .

α = (23 ± 4) 10 -4 χαλάζι-1 στο P = 0,95.

Παράδειγμα 3.Απαιτείται ο προσδιορισμός της ακτίνας καμπυλότητας του φακού χρησιμοποιώντας τους δακτυλίους του Νεύτωνα. Μετρήθηκαν οι ακτίνες των δακτυλίων του Νεύτωνα r m και προσδιορίστηκαν οι αριθμοί αυτών των δακτυλίων m. Οι ακτίνες των δακτυλίων του Νεύτωνα σχετίζονται με την ακτίνα καμπυλότητας του φακού R και τον αριθμό του δακτυλίου από την εξίσωση

r 2 m = mλR - 2d 0 R,

όπου d 0 είναι το πάχος του κενού μεταξύ του φακού και της επίπεδης παράλληλης πλάκας (ή η παραμόρφωση του φακού),

λ είναι το μήκος κύματος του προσπίπτοντος φωτός.

λ = (600 ± 6) nm; r 2 m = y; m = x; λR = b; -2d 0 R = a,

τότε η εξίσωση θα πάρει τη μορφή y = a + bx.

Εισάγονται τα αποτελέσματα των μετρήσεων και των υπολογισμών πίνακας 7.

Πίνακας 7

y = r 2, 10 -2 mm 2

y - bx - a, 10 -4

(y - bx - a) 2 , 10 -6

Υπολογίζουμε:

1. α και β σύμφωνα με τους τύπους (21), (22).

a = ¯r 2 - b¯m = (0,208548333 - 0,0594957 3,5) = 0,0003133 mm 2 .

2. Υπολογίστε τα σφάλματα ρίζας-μέσου τετραγώνου για τις τιμές b και a χρησιμοποιώντας τους τύπους (23), (24)

3. Με αξιοπιστία P = 0,95, χρησιμοποιώντας τον πίνακα των συντελεστών Student για n = 6, βρίσκουμε t = 2,57 και προσδιορίζουμε τα απόλυτα σφάλματα

Δb = 2,57 · 0,000211179 = 6·10 -4 mm 2 ;

Δa = 2,57 0,000822424 = 3 10 -3 mm 2 .

4. Καταγράψτε τα αποτελέσματα

b = (595 ± 6) 10 -4 mm 2 σε P = 0,95;

a = (0,3 ± 3)·10 -3 mm 2 σε P = 0,95;

Από τα πειραματικά αποτελέσματα που προέκυψαν, προκύπτει ότι, εντός του σφάλματος αυτού του πειράματος, η ευθεία r 2 m = ƒ(m) διέρχεται από την αρχή των συντεταγμένων, επειδή Εάν το σφάλμα στην τιμή οποιασδήποτε παραμέτρου αποδειχθεί ότι είναι συγκρίσιμο ή υπερβαίνει την τιμή της παραμέτρου, αυτό σημαίνει ότι πιθανότατα η πραγματική τιμή αυτής της παραμέτρου είναι μηδέν.

Υπό τις συνθήκες αυτού του πειράματος, η τιμή του a δεν ενδιαφέρει. Επομένως, δεν θα ασχοληθούμε άλλο με αυτό.

5. Υπολογίστε την ακτίνα καμπυλότητας του φακού:

R = b / λ = 594,5 / 6 = 99,1 mm.

6. Εφόσον δίνεται συστηματικό σφάλμα για το μήκος κύματος, ας υπολογίσουμε και το συστηματικό σφάλμα για το R χρησιμοποιώντας τον τύπο (16), λαμβάνοντας ως συστηματικό σφάλμα της ποσότητας b το τυχαίο σφάλμα Δb.

Καταγράφουμε το τελικό αποτέλεσμα R = (99 ± 2) mmε ≈ 3% σε P = 0,95.

Η προσέγγιση των πειραματικών δεδομένων είναι μια μέθοδος που βασίζεται στην αντικατάσταση των πειραματικά ληφθέντων δεδομένων με μια αναλυτική συνάρτηση που περνά ή συμπίπτει περισσότερο σε κομβικά σημεία με τις αρχικές τιμές (δεδομένα που λαμβάνονται κατά τη διάρκεια ενός πειράματος ή πειράματος). Επί του παρόντος, υπάρχουν δύο τρόποι για να ορίσετε μια αναλυτική συνάρτηση:

Κατασκευάζοντας ένα πολυώνυμο παρεμβολής n-βαθμών που περνά απευθείας σε όλα τα σημείαέναν δεδομένο πίνακα δεδομένων. Σε αυτή την περίπτωση, η συνάρτηση προσέγγισης παρουσιάζεται με τη μορφή: πολυωνύμου παρεμβολής σε μορφή Lagrange ή πολυωνύμου παρεμβολής σε μορφή Newton.

Κατασκευάζοντας ένα πολυώνυμο προσεγγιστικό n βαθμού που περνά σε άμεση γειτνίαση με σημείααπό έναν δεδομένο πίνακα δεδομένων. Έτσι, η συνάρτηση προσέγγισης εξομαλύνει όλους τους τυχαίους θορύβους (ή σφάλματα) που μπορεί να προκύψουν κατά τη διάρκεια του πειράματος: οι μετρούμενες τιμές κατά τη διάρκεια του πειράματος εξαρτώνται από τυχαίους παράγοντες που κυμαίνονται σύμφωνα με τους δικούς τους τυχαίους νόμους (λάθη μέτρησης ή οργάνου, ανακρίβεια ή πειραματικά Σφάλματα). Σε αυτή την περίπτωση, η συνάρτηση προσέγγισης προσδιορίζεται χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Μέθοδος ελάχιστου τετραγώνου(στην αγγλική βιβλιογραφία Ordinary Least Squares, OLS) είναι μια μαθηματική μέθοδος που βασίζεται στον προσδιορισμό μιας προσεγγιστικής συνάρτησης που κατασκευάζεται στην πιο κοντινή απόσταση από σημεία από μια δεδομένη σειρά πειραματικών δεδομένων. Η εγγύτητα της αρχικής και της προσεγγιστικής συνάρτησης F(x) καθορίζεται από ένα αριθμητικό μέτρο, δηλαδή: το άθροισμα των τετραγωνικών αποκλίσεων των πειραματικών δεδομένων από την προσεγγιστική καμπύλη F(x) πρέπει να είναι το μικρότερο.

Προσεγγιστική καμπύλη που κατασκευάστηκε με τη μέθοδο των ελαχίστων τετραγώνων

Χρησιμοποιείται η μέθοδος των ελαχίστων τετραγώνων:

Για την επίλυση υπερκαθορισμένων συστημάτων εξισώσεων όταν ο αριθμός των εξισώσεων υπερβαίνει τον αριθμό των αγνώστων.

Να βρεθεί λύση στην περίπτωση συνηθισμένων (όχι υπερκαθορισμένων) μη γραμμικών συστημάτων εξισώσεων.

Για να προσεγγίσετε τις τιμές των σημείων με κάποια συνάρτηση κατά προσέγγιση.

Η συνάρτηση προσέγγισης με τη χρήση της μεθόδου των ελαχίστων τετραγώνων προσδιορίζεται από τη συνθήκη του ελάχιστου αθροίσματος των τετραγωνικών αποκλίσεων της υπολογισμένης προσεγγιστικής συνάρτησης από μια δεδομένη σειρά πειραματικών δεδομένων. Αυτό το κριτήριο της μεθόδου των ελαχίστων τετραγώνων γράφεται ως η ακόλουθη έκφραση:

Οι τιμές της υπολογισμένης συνάρτησης προσέγγισης στα κομβικά σημεία,

Μια δεδομένη σειρά πειραματικών δεδομένων σε κομβικά σημεία.

Το τετραγωνικό κριτήριο έχει μια σειρά από «καλές» ιδιότητες, όπως η διαφοροποίηση, παρέχοντας μια μοναδική λύση στο πρόβλημα προσέγγισης με συναρτήσεις πολυωνυμικής προσέγγισης.

Ανάλογα με τις συνθήκες του προβλήματος, η προσεγγιστική συνάρτηση είναι ένα πολυώνυμο βαθμού m

Ο βαθμός της προσεγγιστικής συνάρτησης δεν εξαρτάται από τον αριθμό των κομβικών σημείων, αλλά η διάστασή της πρέπει πάντα να είναι μικρότερη από τη διάσταση (αριθμός σημείων) ενός δεδομένου πειραματικού πίνακα δεδομένων.

∙ Αν ο βαθμός της προσεγγιστικής συνάρτησης είναι m=1, τότε προσεγγίζουμε την πίνακα συνάρτησης με ευθεία γραμμή (γραμμική παλινδρόμηση).

∙ Αν ο βαθμός της προσεγγιστικής συνάρτησης είναι m=2, τότε προσεγγίζουμε τη συνάρτηση πίνακα με τετραγωνική παραβολή (τετραγωνική προσέγγιση).

∙ Αν ο βαθμός της προσεγγιστικής συνάρτησης είναι m=3, τότε προσεγγίζουμε τη συνάρτηση πίνακα με κυβική παραβολή (κυβική προσέγγιση).

Στη γενική περίπτωση, όταν είναι απαραίτητο να κατασκευαστεί ένα προσεγγιστικό πολυώνυμο βαθμού m για δεδομένες τιμές πίνακα, η συνθήκη για το ελάχιστο άθροισμα των τετραγωνικών αποκλίσεων σε όλα τα κομβικά σημεία ξαναγράφεται με την ακόλουθη μορφή:

- άγνωστοι συντελεστές του κατά προσέγγιση πολυωνύμου βαθμού m.

Ο αριθμός των τιμών του πίνακα που καθορίζεται.

Απαραίτητη προϋπόθεση για την ύπαρξη ενός ελάχιστου συνάρτησης είναι η ισότητα προς το μηδέν των μερικών παραγώγων της σε σχέση με άγνωστες μεταβλητές . Ως αποτέλεσμα, λαμβάνουμε το ακόλουθο σύστημα εξισώσεων:

Ας μετατρέψουμε το προκύπτον γραμμικό σύστημα εξισώσεων: ανοίξτε τις αγκύλες και μετακινήστε τους ελεύθερους όρους στη δεξιά πλευρά της παράστασης. Ως αποτέλεσμα, το προκύπτον σύστημα γραμμικών αλγεβρικών παραστάσεων θα γραφτεί με την ακόλουθη μορφή:

Αυτό το σύστημα γραμμικών αλγεβρικών παραστάσεων μπορεί να ξαναγραφτεί σε μορφή πίνακα:

Ως αποτέλεσμα, προέκυψε ένα σύστημα γραμμικών εξισώσεων διάστασης m+1, το οποίο αποτελείται από m+1 αγνώστους. Αυτό το σύστημα μπορεί να λυθεί χρησιμοποιώντας οποιαδήποτε μέθοδο για την επίλυση γραμμικών αλγεβρικών εξισώσεων (για παράδειγμα, τη μέθοδο Gaussian). Ως αποτέλεσμα της λύσης, θα βρεθούν άγνωστες παράμετροι της συνάρτησης προσέγγισης που παρέχουν το ελάχιστο άθροισμα τετραγωνικών αποκλίσεων της προσεγγιστικής συνάρτησης από τα αρχικά δεδομένα, δηλ. καλύτερη δυνατή τετραγωνική προσέγγιση. Θα πρέπει να θυμόμαστε ότι αν αλλάξει έστω και μία τιμή των δεδομένων προέλευσης, όλοι οι συντελεστές θα αλλάξουν τις τιμές τους, καθώς καθορίζονται πλήρως από τα δεδομένα προέλευσης.

Προσέγγιση των δεδομένων πηγής με γραμμική εξάρτηση

(γραμμικής παλινδρόμησης)

Ως παράδειγμα, ας εξετάσουμε την τεχνική για τον προσδιορισμό της συνάρτησης προσέγγισης, η οποία καθορίζεται με τη μορφή γραμμικής εξάρτησης. Σύμφωνα με τη μέθοδο των ελαχίστων τετραγώνων, η συνθήκη για το ελάχιστο άθροισμα των τετραγωνικών αποκλίσεων γράφεται με την ακόλουθη μορφή:

Συντεταγμένες κόμβων πίνακα.

Άγνωστοι συντελεστές της συνάρτησης προσέγγισης, η οποία καθορίζεται ως γραμμική εξάρτηση.

Απαραίτητη προϋπόθεση για την ύπαρξη ενός ελάχιστου μιας συνάρτησης είναι η ισότητα προς το μηδέν των μερικών παραγώγων της ως προς άγνωστες μεταβλητές. Ως αποτέλεσμα, λαμβάνουμε το ακόλουθο σύστημα εξισώσεων:

Ας μετατρέψουμε το γραμμικό σύστημα εξισώσεων που προκύπτει.

Λύνουμε το προκύπτον σύστημα γραμμικών εξισώσεων. Οι συντελεστές της προσεγγιστικής συνάρτησης σε αναλυτική μορφή προσδιορίζονται ως εξής (μέθοδος Cramer):

Αυτοί οι συντελεστές εξασφαλίζουν την κατασκευή μιας γραμμικής συνάρτησης προσέγγισης σύμφωνα με το κριτήριο της ελαχιστοποίησης του αθροίσματος των τετραγώνων της συνάρτησης προσέγγισης από τις δεδομένες τιμές πίνακα (πειραματικά δεδομένα).

Αλγόριθμος για την υλοποίηση της μεθόδου των ελαχίστων τετραγώνων

1. Αρχικά δεδομένα:

Καθορίζεται μια σειρά πειραματικών δεδομένων με τον αριθμό των μετρήσεων N

Καθορίζεται ο βαθμός του προσεγγιστικού πολυωνύμου (m).

2. Αλγόριθμος υπολογισμού:

2.1. Οι συντελεστές προσδιορίζονται για την κατασκευή ενός συστήματος εξισώσεων με διαστάσεις

Συντελεστές του συστήματος εξισώσεων (αριστερή πλευρά της εξίσωσης)

- δείκτης του αριθμού στήλης του τετραγωνικού πίνακα του συστήματος εξισώσεων

Ελεύθεροι όροι ενός συστήματος γραμμικών εξισώσεων (δεξιά πλευρά της εξίσωσης)

- δείκτης του αριθμού σειράς του τετραγωνικού πίνακα του συστήματος εξισώσεων

2.2. Σχηματισμός συστήματος γραμμικών εξισώσεων με διάσταση .

2.3. Επίλυση συστήματος γραμμικών εξισώσεων για τον προσδιορισμό των άγνωστων συντελεστών ενός κατά προσέγγιση πολυωνύμου βαθμού m.

2.4 Προσδιορισμός του αθροίσματος των τετραγωνικών αποκλίσεων του προσεγγιστικού πολυωνύμου από τις αρχικές τιμές σε όλα τα κομβικά σημεία

Η ευρεθείσα τιμή του αθροίσματος των τετραγωνικών αποκλίσεων είναι η ελάχιστη δυνατή.

Προσέγγιση με χρήση άλλων συναρτήσεων

Πρέπει να σημειωθεί ότι κατά την προσέγγιση των αρχικών δεδομένων σύμφωνα με τη μέθοδο των ελαχίστων τετραγώνων, η λογαριθμική συνάρτηση, η εκθετική συνάρτηση και η συνάρτηση ισχύος χρησιμοποιούνται μερικές φορές ως συνάρτηση προσέγγισης.

Λογαριθμική προσέγγιση

Ας εξετάσουμε την περίπτωση που η προσεγγιστική συνάρτηση δίνεται από μια λογαριθμική συνάρτηση της μορφής:

Έχει πολλές εφαρμογές, καθώς επιτρέπει μια κατά προσέγγιση αναπαράσταση μιας δεδομένης συνάρτησης από άλλες απλούστερες. Το LSM μπορεί να είναι εξαιρετικά χρήσιμο στην επεξεργασία των παρατηρήσεων και χρησιμοποιείται ενεργά για την εκτίμηση ορισμένων ποσοτήτων με βάση τα αποτελέσματα μετρήσεων άλλων που περιέχουν τυχαία σφάλματα. Σε αυτό το άρθρο, θα μάθετε πώς να εφαρμόζετε υπολογισμούς ελαχίστων τετραγώνων στο Excel.

Δήλωση του προβλήματος χρησιμοποιώντας ένα συγκεκριμένο παράδειγμα

Ας υποθέσουμε ότι υπάρχουν δύο δείκτες X και Y. Επιπλέον, το Y εξαρτάται από το X. Επειδή το OLS μας ενδιαφέρει από την άποψη της ανάλυσης παλινδρόμησης (στο Excel οι μέθοδοί του υλοποιούνται χρησιμοποιώντας ενσωματωμένες συναρτήσεις), θα πρέπει να προχωρήσουμε αμέσως στην εξέταση ενός συγκεκριμένο πρόβλημα.

Έτσι, έστω Χ ο χώρος λιανικής ενός παντοπωλείου, μετρημένος σε τετραγωνικά μέτρα, και Υ ο ετήσιος τζίρος, μετρημένος σε εκατομμύρια ρούβλια.

Απαιτείται να γίνει πρόβλεψη για το τι τζίρο (Υ) θα έχει το κατάστημα αν έχει αυτόν ή τον άλλο χώρο λιανικής. Προφανώς, η συνάρτηση Y = f (X) αυξάνεται, αφού η υπεραγορά πουλάει περισσότερα αγαθά από το περίπτερο.

Λίγα λόγια για την ορθότητα των αρχικών δεδομένων που χρησιμοποιούνται για την πρόβλεψη

Ας υποθέσουμε ότι έχουμε έναν πίνακα που έχει κατασκευαστεί χρησιμοποιώντας δεδομένα για n καταστήματα.

Σύμφωνα με τις μαθηματικές στατιστικές, τα αποτελέσματα θα είναι λίγο πολύ σωστά εάν εξεταστούν δεδομένα για τουλάχιστον 5-6 αντικείμενα. Επιπλέον, δεν μπορούν να χρησιμοποιηθούν «ανώμαλα» αποτελέσματα. Συγκεκριμένα, μια ελίτ μικρή μπουτίκ μπορεί να έχει τζίρο αρκετές φορές μεγαλύτερο από τον τζίρο μεγάλων καταστημάτων λιανικής της κατηγορίας «masmarket».

Η ουσία της μεθόδου

Τα δεδομένα του πίνακα μπορούν να απεικονιστούν σε ένα καρτεσιανό επίπεδο με τη μορφή σημείων M 1 (x 1, y 1), ... M n (x n, y n). Τώρα η λύση του προβλήματος θα περιοριστεί στην επιλογή μιας προσεγγιστικής συνάρτησης y = f (x), η οποία έχει μια γραφική παράσταση που περνά όσο το δυνατόν πιο κοντά στα σημεία M 1, M 2, .. M n.

Φυσικά, μπορείτε να χρησιμοποιήσετε ένα πολυώνυμο υψηλού βαθμού, αλλά αυτή η επιλογή δεν είναι μόνο δύσκολη στην εφαρμογή, αλλά και απλά λανθασμένη, καθώς δεν θα αντικατοπτρίζει την κύρια τάση που πρέπει να εντοπιστεί. Η πιο λογική λύση είναι να αναζητήσετε την ευθεία y = ax + b, η οποία προσεγγίζει καλύτερα τα πειραματικά δεδομένα, ή ακριβέστερα, τους συντελεστές a και b.

Αξιολόγηση ακρίβειας

Με οποιαδήποτε προσέγγιση, η αξιολόγηση της ακρίβειάς του έχει ιδιαίτερη σημασία. Ας συμβολίσουμε με e i τη διαφορά (απόκλιση) μεταξύ των λειτουργικών και πειραματικών τιμών για το σημείο x i, δηλαδή e i = y i - f (x i).

Προφανώς, για να εκτιμήσετε την ακρίβεια της προσέγγισης, μπορείτε να χρησιμοποιήσετε το άθροισμα των αποκλίσεων, δηλ., όταν επιλέγετε μια ευθεία γραμμή για μια κατά προσέγγιση αναπαράσταση της εξάρτησης του X από το Y, θα πρέπει να προτιμάτε αυτή με τη μικρότερη τιμή του άθροισμα e i σε όλα τα υπό εξέταση σημεία. Ωστόσο, δεν είναι όλα τόσο απλά, αφού μαζί με τις θετικές αποκλίσεις θα υπάρχουν και αρνητικές.

Το πρόβλημα μπορεί να λυθεί χρησιμοποιώντας μονάδες απόκλισης ή τα τετράγωνά τους. Η τελευταία μέθοδος είναι η πιο ευρέως χρησιμοποιούμενη. Χρησιμοποιείται σε πολλούς τομείς, συμπεριλαμβανομένης της ανάλυσης παλινδρόμησης (που εφαρμόζεται στο Excel χρησιμοποιώντας δύο ενσωματωμένες συναρτήσεις) και έχει αποδείξει εδώ και καιρό την αποτελεσματικότητά του.

Μέθοδος ελάχιστου τετραγώνου

Το Excel, όπως γνωρίζετε, έχει μια ενσωματωμένη λειτουργία AutoSum που σας επιτρέπει να υπολογίζετε τις τιμές όλων των τιμών που βρίσκονται στην επιλεγμένη περιοχή. Έτσι, τίποτα δεν θα μας εμποδίσει να υπολογίσουμε την τιμή της παράστασης (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Σε μαθηματική σημειογραφία, αυτό μοιάζει με:

Δεδομένου ότι αρχικά ελήφθη η απόφαση να γίνει προσέγγιση χρησιμοποιώντας μια ευθεία γραμμή, έχουμε:

Έτσι, το έργο της εύρεσης της ευθείας γραμμής που περιγράφει καλύτερα τη συγκεκριμένη εξάρτηση των μεγεθών X και Y καταλήγει στον υπολογισμό του ελάχιστου συνάρτησης δύο μεταβλητών:

Για να γίνει αυτό, πρέπει να εξισώσετε τις μερικές παραγώγους σε σχέση με τις νέες μεταβλητές a και b με μηδέν και να λύσετε ένα πρωτόγονο σύστημα που αποτελείται από δύο εξισώσεις με 2 άγνωστα της μορφής:

Μετά από μερικούς απλούς μετασχηματισμούς, συμπεριλαμβανομένης της διαίρεσης με το 2 και του χειρισμού των αθροισμάτων, έχουμε:

Λύνοντάς το, για παράδειγμα, χρησιμοποιώντας τη μέθοδο του Cramer, παίρνουμε ένα ακίνητο σημείο με ορισμένους συντελεστές a * και b *. Αυτό είναι το ελάχιστο, δηλαδή για να προβλέψουμε τι τζίρο θα έχει ένα κατάστημα για μια συγκεκριμένη περιοχή, είναι κατάλληλη η ευθεία γραμμή y = a * x + b *, η οποία είναι ένα μοντέλο παλινδρόμησης για το εν λόγω παράδειγμα. Φυσικά, δεν θα σας επιτρέψει να βρείτε το ακριβές αποτέλεσμα, αλλά θα σας βοηθήσει να πάρετε μια ιδέα για το εάν η αγορά μιας συγκεκριμένης περιοχής με πίστωση καταστήματος θα αποδώσει.

Πώς να εφαρμόσετε τα ελάχιστα τετράγωνα στο Excel

Το Excel έχει μια συνάρτηση για τον υπολογισμό τιμών με χρήση ελαχίστων τετραγώνων. Έχει την ακόλουθη μορφή: «TREND» (γνωστές τιμές Y, γνωστές τιμές X, νέες τιμές X, σταθερά). Ας εφαρμόσουμε τον τύπο για τον υπολογισμό του OLS στο Excel στον πίνακά μας.

Για να το κάνετε αυτό, εισαγάγετε το σύμβολο "=" στο κελί στο οποίο θα πρέπει να εμφανίζεται το αποτέλεσμα του υπολογισμού με τη μέθοδο των ελαχίστων τετραγώνων στο Excel και επιλέξτε τη συνάρτηση "TREND". Στο παράθυρο που ανοίγει, συμπληρώστε τα κατάλληλα πεδία, επισημαίνοντας:

  • εύρος γνωστών τιμών για το Y (σε αυτήν την περίπτωση, δεδομένα για τον εμπορικό κύκλο εργασιών).
  • εύρος x 1 , …x n , δηλαδή το μέγεθος του χώρου λιανικής.
  • Τόσο γνωστές όσο και άγνωστες τιμές του x, για τις οποίες πρέπει να μάθετε το μέγεθος του κύκλου εργασιών (για πληροφορίες σχετικά με τη θέση τους στο φύλλο εργασίας, δείτε παρακάτω).

Επιπλέον, ο τύπος περιέχει τη λογική μεταβλητή "Const". Εάν εισαγάγετε 1 στο αντίστοιχο πεδίο, αυτό θα σημαίνει ότι πρέπει να κάνετε τους υπολογισμούς, υποθέτοντας ότι b = 0.

Εάν πρέπει να μάθετε την πρόβλεψη για περισσότερες από μία τιμές x, τότε αφού εισαγάγετε τον τύπο δεν πρέπει να πατήσετε "Enter", αλλά πρέπει να πληκτρολογήσετε τον συνδυασμό "Shift" + "Control" + "Enter" στο πληκτρολόγιο.

Κάποια χαρακτηριστικά

Η ανάλυση παλινδρόμησης μπορεί να είναι προσβάσιμη ακόμη και σε ανδρείκελα. Ο τύπος του Excel για την πρόβλεψη της τιμής μιας σειράς άγνωστων μεταβλητών—TREND—μπορεί να χρησιμοποιηθεί ακόμη και από εκείνους που δεν έχουν ακούσει ποτέ για ελάχιστα τετράγωνα. Αρκεί μόνο να γνωρίζουμε μερικά από τα χαρακτηριστικά της δουλειάς του. Συγκεκριμένα:

  • Εάν τακτοποιήσετε το εύρος των γνωστών τιμών της μεταβλητής y σε μία γραμμή ή στήλη, τότε κάθε σειρά (στήλη) με γνωστές τιμές x θα γίνει αντιληπτή από το πρόγραμμα ως ξεχωριστή μεταβλητή.
  • Εάν μια περιοχή με γνωστό x δεν καθορίζεται στο παράθυρο TREND, τότε όταν χρησιμοποιείτε τη συνάρτηση στο Excel, το πρόγραμμα θα την αντιμετωπίσει ως έναν πίνακα που αποτελείται από ακέραιους αριθμούς, ο αριθμός των οποίων αντιστοιχεί στο εύρος με τις δεδομένες τιμές του μεταβλητή y.
  • Για να εξάγετε έναν πίνακα "προβλεπόμενων" τιμών, η έκφραση για τον υπολογισμό της τάσης πρέπει να εισαχθεί ως τύπος πίνακα.
  • Εάν δεν καθορίζονται νέες τιμές του x, τότε η συνάρτηση TREND τις θεωρεί ίσες με τις γνωστές. Εάν δεν καθορίζονται, τότε ο πίνακας 1 λαμβάνεται ως όρισμα. 2; 3; 4;…, το οποίο είναι ανάλογο με το εύρος με τις ήδη καθορισμένες παραμέτρους y.
  • Το εύρος που περιέχει τις νέες τιμές x πρέπει να έχει τις ίδιες ή περισσότερες σειρές ή στήλες με το εύρος που περιέχει τις δεδομένες τιμές y. Με άλλα λόγια, πρέπει να είναι ανάλογη με τις ανεξάρτητες μεταβλητές.
  • Ένας πίνακας με γνωστές τιμές x μπορεί να περιέχει πολλές μεταβλητές. Ωστόσο, εάν μιλάμε μόνο για ένα, τότε απαιτείται οι περιοχές με τις δεδομένες τιμές των x και y να είναι ανάλογες. Στην περίπτωση πολλών μεταβλητών, είναι απαραίτητο το εύρος με τις δεδομένες τιμές y να χωράει σε μία στήλη ή μία γραμμή.

Λειτουργία ΠΡΟΒΛΕΨΗΣ

Υλοποιήθηκε χρησιμοποιώντας πολλές λειτουργίες. Ένα από αυτά ονομάζεται «ΠΡΟΒΛΕΨΗ». Είναι παρόμοιο με το "TREND", δηλαδή δίνει το αποτέλεσμα των υπολογισμών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Ωστόσο, μόνο για ένα Χ, για το οποίο η τιμή του Υ είναι άγνωστη.

Τώρα γνωρίζετε τύπους στο Excel για ανδρείκελα που σας επιτρέπουν να προβλέψετε τη μελλοντική τιμή ενός συγκεκριμένου δείκτη σύμφωνα με μια γραμμική τάση.



gastroguru 2017