lezioni di matematica

202
Appunti di Matematica Simone Secchi Dipartimento di Matematica ed Applicazioni Università degli Studi di Milano–Bicocca 22 febbraio 2009

Upload: paperino-paperut

Post on 10-Jun-2015

2.491 views

Category:

Documents


7 download

DESCRIPTION

Lecture notes for an italian course of calculus

TRANSCRIPT

Page 1: lezioni di matematica

Appunti di Matematica

Simone SecchiDipartimento di Matematica ed ApplicazioniUniversità degli Studi di Milano–Bicocca

22 febbraio 2009

Page 2: lezioni di matematica

ii

Page 3: lezioni di matematica

Prefazione

Le dispense che state leggendo nascono dall’esperienza di insegnamento delcorso di Matematica per gli allievi biotecnologi dell’Università degli Studi diMilano–Bicocca. Il programma del corso è piuttosto vasto, e la prima diffi-coltà è stata quella di scegliere un libro di testo. Alcune esigenze hanno resomolto difficile questo compito: innanzitutto è opportuno utilizzare materialein lingua italiana, onde evitare di aggiungere la difficoltà di apprendimentoin una lingua straniera a quella intrinseca della materia. Inoltre, la presen-za di argomenti piuttosto avanzati (introduzione alle equazioni differenzialiordinarie, cenni ai metodi di approssimazione) esclude la maggioranza delleopere attualmente presenti sul mercato.

Dalle discussioni con alcuni insegnanti di scuola media superiore, è emersochiaramente l’abbassamento del livello dei programmi scolastici rispetto aquelli di vent’anni fa. Basti dire che, nei licei scientifici e nei principaliistituti tecnici degli anni ’90 del secolo scorso, era consuetudine insegnaretutti gli argomenti che tratteremo in queste dispense, sebbene con pochedimostrazioni rigorose. Non era raro, poi, studiare il calcolo combinatorico equalche concetto di probabilità elementare. È chiaro che i testi più datati diIstituzioni di Matematica sono ormai inutilizzabili per i nuovi corsi.

Questi appunti non sostituiscono in alcun modo un buon libro di testo,ad esempio quelli elencati in bibiliografia o quelli consigliati nelle informazio-ni sul corso all’URL http://www.matapp.unimib.it/~secchi nella sezionededicata alla didattica. Piuttosto vengono proposti per non “perdere la bus-sola” durante lo studio dei testi più autorevoli. Ogni capitolo costituisce unargomento o una serie di argomenti affini, che costituiscono l’ossatura delcorso di Matematica per la laurea di primo livello in Biotecnologie, Biologia,e più generalmente in tutti i corsi dove non si debba insegnare il calcolo ma-triciale e vettoriale. In questa versione ho inserito, per completezza, un brevecapitolo sulle serie numeriche (di numeri reali). Difficilmente c’è il tempo perinsegnare anche questo argomento, che in effetti sarebbe utile affrontare. Ilcapitolo sulle serie non è comunque indispensabile alla comprensione del restodelle dispense.

iii

Page 4: lezioni di matematica

iv

Gli argomenti trattati sono quelli classici, esposti nell’ordine più clas-sico:1 brevi richiami di insiemistica e di teoria elementare delle funzioni,successioni e loro limiti, limiti di funzioni e funzioni continue, derivazione,integrazione secondo Riemann. I prerequisiti sono quelli di ogni corso di ma-tematica a livello universitario, e comprendono l’algebra delle scuole supe-riori, i principi della geometria analitica nel piano, le più importanti formuledella trigonometria e possibilmente la capacità di usare la logica elementare.

In queste dispense mancano, salvo poche eccezioni, esempi ed applicazio-ni. D’altronde, libri di testo pieni di figure e di esempi banali abbondanoin ogni biblioteca universitaria. Personalmente ho sempre faticato ad im-parare la matematica su questo genere di libri, e posso garantire che molteapplicazioni sono in realtà accademiche.

Nell’ultimo decennio, l’università italiana ha subito molti cambiamenti.La (presunta) urgenza di aumentare il numero di laureati ha spinto il legi-slatore a ridurre e semplificare il percorso formativo degli studenti. Se primaavevamo – poniamo – cento laureati provenienti da lunghi corsi annuali diotto mesi, ora abbiamo centoventi laureati che hanno assorbito come spugnegli stessi contenuti esposti però superficialmente. Non è difficile comprendereche i corsi di matematica generale per le lauree scientifiche hanno sopportatotagli ed abusi di ogni sorta. Allo stato attuale delle cose (ma si sa che al peg-gio non c’è mai fine), l’antico corso di matematica che si estendeva da ottobrea giugno è ridotto ad un corso di dodici settimane all inclusive. Per amoreo per forza, il programma si è apertamente sbilanciato verso il calculus delleuniversità americane. Studiando su alcuni libri italiani più recenti, sembrache tutto si riduca a qualche tecnica di calcolo da apprendere alla stregua del-la ricetta per fare una torta. Questo approccio non sarebbe privo di utilità,purché al primo corso di calculus ne seguisse uno di mathematical analysis.Purtroppo (per chi scrive) o per fortuna (per chi deve ancora laurearsi), nelcorso di laurea in biotecnologie non c’è spazio per un corso avanzato di ma-tematica. Queste dispense si propongono come un ragionevole compromessofra la praticità del calcolo e il rigore dell’analisi matematica.

1Recentemente, sono apparsi sul mercato testi, non ancora tradotti in italiano, chevantano una presentazione dell’analisi matematica classica secondo un ordine “naturale”.Occorre dire che il cammino cronologico della matematica non rispecchia fedelmente quellodei capitoli delle nostre dispense. La derivabilità è stata studiata euristicamente primache si fosse capito il concetto di continuità. Per molti anni ha fatto scuola l’approccioalla Bourbaki, in cui la deduzione logica prevale sulla storia: se tutte le funzioni derivabilirisultano continue, è meglio allora spiegare innanzitutto che cosa sia una funzione conti-nua. Personalmente penso che per fare matematica si più conveniente apprenderne le basisecondo la dipendenza logica. Uno storico della matematica ha probabilmente un’opinionediversa in materia.

Page 5: lezioni di matematica

v

La teoria elementare delle successioni viene esposta come primo esempioper lo studio dei limiti. Infatti, la definizione di limite per una successione(di numeri reali) è più immediata di quella per una funzione reale di unavariabile reale. Sebbene l’esperienza mi abbia dimostrato che le successioninon sono un argomento che eccita gli studenti, continuo a credere che can-cellarle completamente dagli argomenti trattati sarebbe una perdita più cheun guadagno.

Nelle prime pagine ho inserito alcuni cenni, volutamente superficiali epratici, di logica booleana elementare. Di fatto, è emerso che la più grandedifficoltà per gli studenti del primo anno è l’abitudine a trarre conclusionilogiche da ipotesi astratte o sperimentali. È importante, in matematica,sapere che se un insieme di oggetti è descritto dalla “sovrapposizione” di dueo più condizioni, gli oggetti che non cadono in questo insieme sono quelli chenon soddisfano almeno una dell e suddette condizioni. Altrettanto inevitabileè l’uso delle espressioni “per ogni” ed “esiste”, che appaiono praticamente inogni teorema. Ho comunque preferito non usare la simbologia della logica,come ∀ al posto di “per ogni”, ∃ al posto di “esiste”, ⇒ al posto di “implica”.La definizione di continuità per una funzione f : [a, b]→ R in x0 si leggerebbe

(∀ε > 0)(∃δ > 0)(∀x ∈ [a, b])(|x− x0| < δ)⇒ (|f(x)− f(x0)| < ε).

Qualunque studente inizia a barcollare di fronte a questa scrittura. Sebbe-ne la notazione “logica” abbia un’eleganza fuori dall’ordinario, ho preferitoattenermi a un linguaggio più discorsivo.

In alcuni casi, ho privilegiato notazioni e convenzioni minoritarie nellaletteratura italiana. Per fare qualche esempio, ho usato sistematicamente lanotazione operatoriale Df per la derivata di una funzione f . Quasi tuttiscrivono f ′, ma per uno studente forse è meno evidente che la derivazione èun’operazione applicata alle funzioni.

Nel contesto delle successioni, ho usato l’aggettivo “divergente” come ne-gazione di “convergente”. Ciò contrasta con la tradizione italiana, che distin-gue le successioni divergenti (all’infinito) da quelle oscillanti fra due valorifiniti o infiniti. Per essere espliciti, i testi italiani dicono che {n2} è una suc-cessione divergente, mentre {(−1)n} è indeterminata. Capiterà spesso, tutta-via, di scrivere o pronunciare frasi come “la successione pn tende all’infinito”,al posto della più corretta “la successione pn diverge a infinito”.

In questa versione aggiornata ho introdotto un breve paragrafo sull’inte-grazione indefinita. Coerentemente con l’impostazione adottata, mi limitoa qualche cenno. La scelta di trascurare completamente questo argomentoappariva forse arrogante e snob: se un matematico o un fisico possono giudi-care perfino noiose le tecniche di calcolo delle primitive, un biotecnologo habisogno anche di imparare a fare qualche calcolo di routine.

Page 6: lezioni di matematica

vi

Il capito sull’integrazione secondo Riemann fornisce una trattazione pi ùampia di quella presente in molti libri di testo. Difficilmente c’è il tempoper discutere tutti i dettagli in aula, ma la scelta di riassumere l’integrazionedefinita in due o tre pagine di teoremi calati dall’alto non mi convince.

L’ultimo capitolo è un assaggio di calcolo numerico e approssimato. Sonofortemente critico sull’opportunità di inserire questi argomenti in un corso dimatematica generale. Delle due l’una: o si insegna un’analisi numerica rigo-rosa, fatta di teoremi e dimostrazioni, e allora occorrono molte ore di lezione;oppure si mostra qualche tecnica senza troppi dettagli, e allora servirebbeuna ausilio informatico che renda interessanti i contenuti dal punto di vistasperimentale. Poiché risulta impossibile, per varie ragione, attuare entram-be le alternative, forse sarebbe meglio recuperare delle ore per approfondireargomenti già introdotti.

Concludo con un’osservazione non particolarmente originale. La mate-matica è come uno sport: senza esercizio non si fa molta strada. Si impara lamatematica facendola, cioè cimentandosi con gli esercizi proposti nelle eserci-tazioni, con le prove d’esame degli anni precedenti, con gli esercizi dei libri ditesto consigliati, e anche sfruttando le ore di ricevimento dei docenti. L’usodella rete Internet non è stato inserito fra le fonti principali di apprendimen-to. Mentre i libri di testo danno una garanzia di correttezza dei contenuti,la ricerca di materiale on line può portare a spiacevoli sorprese. Consigliopertanto di scaricare appunti e esercizi solo da siti ritenuti assolutamenteaffidabili. Con rammarico devo sconsigliare allo studente lo studio sui libridelle scuole superiori. In effetti, il concetto stesso di “dimostrazione rigoro-sa” appare molto vago in quei libri, e la validità di un teorema è giustificatasovente con un paio di esempi. Ricordiamo, come scherzoso ammonimento,la storiella dei tre scenziati che viaggiano in treno: un ingegnere, un fisico eun matematico. Passando accanto a un recinto di pecore, il primo esclama:“Tutte le pecore sono bianche”. Il fisico lo corregge: “Tutte le pecore di questoprato sono bianche”. Interviene infine il matematico: “No, possiamo solo direche esiste un prato in cui ci sono delle pecore, e queste pecore hanno almenoun lato bianco”. A volte si sente dire che il matematico è quello scienziato acui piacciono i controesempi più degli esempi.

Per quanto riguarda gli esercizi, molti dei testi elencati in bibliografia (e inparticolare [6] e [13]) ne contengono a volontà. Sul sito del corso sono inoltreraccolte le prove scritte e quasi tutte le relative soluzioni commentate. Hopreferito evitare di aggiungere, alla fine di ogni capitolo, la classica paginadi esercizi consigliati. Per uno studente alle prime armi, un esercizio è utilesoprattutto se è accompagnato da una soluzione completa o almeno parziale.Tutti ricordiamo la frustrazione provocata da un esercizio che non sapevamo

Page 7: lezioni di matematica

vii

proprio risolvere. Incoraggio dunque tutti gli studenti ad utilizzare gli eserciziproposti e risolti in [6].

Sono certo che molti dei miei studenti hanno letto fin qui nella speranzadi trovare la frase che ogni Autore si sente in obbligo di inserire nell’intro-duzione alla propria opera: mi sono sforzato di rendere la matematica piùinteressante, inserendo svariati esempi e modelli presi dalla realtà. Si è moltodiscusso sull’opportunità di seguire il metodo “Mary Poppins” per insegnarela matematica alle matricole.2 L’opinione di chi scrive è che gli argomentitrattati sono sufficientemente classici e spesso familiari da lasciare spazio aquel poco di rigore indispensabile in tutte le discipline scientifiche moderne.

Proprietà intellettuale del materiale

Queste dispense sono rese pubbliche senza oneri aggiuntivi mediante pub-blicazione sul sito internet dell’Autore. È consentito l’uso e la riproduzioneper scopi personali di studio e senza fini di lucro. È altresì vietato apportarequalsiasi modifica al testo da parte di terzi.

Di ogni errore e imprecisione è responsabile l’autore. Ringrazio fin d’oraquanti vorranno segnalare considerazioni e commenti sul contenuto di questedispense.

Ringraziamenti tecnico–informatici

Queste dispense sono state redatte utilizzando il sistema di scritturaLATEX3 su computer dotati dei sistemi operativi Apple Mac Os 10.4 e 10.5,GNU/Linux Slackware 12.2, Microsoft Windows XP, e (saltuariamente) SunSolaris 10 su piattaforma AMD64 e PcBSD-7. L’autore è profondamentegrato a Donald Knuth per aver creato a sviluppato il sistema di videoscrit-tura TEX, senza il quale la stesura di queste note sarebbe stata molto piùcomplicata. La variante LATEX è stata costruita da Leslie Lamport, ed è il“dialetto” utilizzato per scrivere queste dispense.

Le figure sono state prodotte dall’autore mediante i programmi XFig4 eMaple.5. La figura 5.1 è stata creata invece con il software Asymptote.6

Cantù e Milano, febbraio 2009.2Basta un poco di zucchero, e la pillola va giù.3Si legge approssimativamente “latek”. L’URL di riferimento è http://www.tug.org4http://www.xfig.org5Maple è un marchio registrato di Maplesoft Inc. http://www.maplesoft.com6http://asymptote.sourceforge.net

Page 8: lezioni di matematica

viii

Page 9: lezioni di matematica

Capitolo 1

Insiemi e Funzioni

1.1 Cenni di logica elementareQualunque scienza esatta è fondata sul ragionamento logico– deduttivo. Pernoi, questo significa che seguiremo alcune leggi di calcolo con le proposizioni.Non avendo né l’obiettivo, né tantomeno il tempo per occuparci della relativateoria, ci limiteremo a brevi cenni.

Innanzitutto, gli oggetti delle nostra logica for dummies sono le propo-sizioni, cioè frasi di senso compiuto. Indicheremo le proposizioni con lettereminuscolo, ad esempio p, q, r, ecc. Una proposizione potrebbe essere “sepiove, prendo l’ombrello”, oppure “la mia squadra del cuore è l’Inter”.

Esattamente come i numeri sono gli atomi del calcolo numerico, le pro-posizioni sono i mattoni con cui costruire il linguaggio della matematica.. Sipensi ad un teorema, che ha la forma “Se è vera p, allora è vera q”. Ogniproposizione assume, nella logica classica, due valori: vero (V) o falso (F).1

Esaminiamo rapidamente le principali operazioni con le proposizioni.

Definizione 1.1. Data una proposizione p, la sua negazione è la proposizione∼ p, che risulta vera quando p è falsa, e falsa quando p è vera. Quindi lasua tavola di verità è

p ∼ pV FF V

Ovviamente, la negazione di una proposizione si effettua seguendo l’in-tuizione: la negazione di “oggi piove” è “oggi non piove”. Occorre prestare

1Gli informatici usano 1 per la verità e 0 per la falsità. Segnaliamo che esiste una logica,detta “fuzzy”, in cui una proposizione può essere qualcosa di diverso da vero o falso.

1

Page 10: lezioni di matematica

2 CAPITOLO 1. INSIEMI E FUNZIONI

attenzione alle insidie del linguaggio comune. Infatti, sarebbe sbagliato affer-mare che la negazione di “oggi piove” è “oggi c’è il sole”. In effetti, potrebbeanche nevicare!

Definizione 1.2. Date due proposizioni p e q, la loro congiunzione p∧ q (silegge: p e q) è vera se e solo se sia p che q sono vere, e falsa in tutte le altresituazioni. La tavola di verità della congiunzione è pertanto

p q p ∧ qV V VV F FF V VF F F

In pratica, congiungere due proposizioni significa metterle a sistema: inparticolare, p ∧ (∼ p) è sempre falsa.

Definizione 1.3. Date due proposizioni p e q, la loro disgiunzione p ∨ q (silegeg: p o q) è vera quando almeno una fra p e q è vera, e falsa altrimenti.La tavola di verità risulta pertanto

p q p ∨ qV V VV F VF V VF F F

Osservazione 1.4. Lo studente faccia attenzione: l’operazione di disgiun-zione è intesa in senso largo, non in senso esclusivo. Nel linguaggio comune,si usa “oppure” per escludere l’eventualità che entrambe le proposizioni sianovere. In matematica, “oppure” non esclude affatto la verità simultanea deidue argomenti. In particolare non è contraddittorio dire che “2 è un numeropari oppure 3 è dispari”.

Veniamo infine all’operazione su cui si costruiscono i teoremi: l’implica-zione.

Definizione 1.5. Date due proposizioni p e q, l’implicazione p⇒ q (si legge:p implica q, oppure “se p allora q”) risponde alla tavola di verità

p q p⇒ qV V VV F FF V VF F V

Page 11: lezioni di matematica

1.1. CENNI DI LOGICA ELEMENTARE 3

Infine, scriveremo brevemente p ⇔ q (da leggere “p se e solo se q”, oppure“p equivale a q”) per indicare la proposizione (p⇒ q) ∧ (q ⇒ p).

Lo studente legga bene la definizione precedente. Non è proprio in li -nea con le aspettative della nostra intuizione, soprattutto nel momento incui si afferma che “falso implica falso” è vero. In realtà, viene semplicementesostenuto che da un’ipotesi falsa può essere tranquillamente dedotta una con-clusione falsa. Si ricordi che la logica proposizionale non giudica il contenutodelle singole proposizioni, ma solo le regole con cui si opera su di esse.

Come detto, i teoremi saranno sempre scritti nella forma, o in forme aquesta rincoducibili, Se p allora q. Lo studente, per esercizio, scriva la tavoladi verità di p⇒ q e di (∼ q)⇒ (∼ p). Il fatto che coincidano non è casuale,ed anzi costituisce la tecnica di dimostrazione per antinomia.

Concludiamo con qualche parola sui quantificatori.

Definizione 1.6. Il quantificatore universale ∀ si legge “per ogni”, mentre ilquantificatore esistenziale ∃ si legge “esiste”.

I quantificatori permettono di comporre proposizioni articolate. Ad esempio

(∀x ∈ R)(∃n ∈ N)(n > x)

si legge “per ogni numero reale x esiste un numero naturale n tale che nè maggiore di x”. Inoltre i quantificatori si negano scambiandoli: la nega-zionei di “per ogni” è “esiste”, e viceversa. La negazione della precedenteproposizione è dunque

(∃x ∈ R)(∀n ∈ N)(n ≤ x),

cioè “esiste un numero reale x tale che, per ogni numero naturale n, risultan è minore o uguale a x”.

Vediamo ora alcuni esempi.

1. Siano p = p(x) = (“x è un numero negativo”) e q = q(x) = (“x2 ≥ 2”).Allora l’insieme E = {x ∈ R | p(x) ∧ q(x)} è l’insieme dei numeri realinegativi, il cui quadrato è più grande (o uguale) di 2. Dunque stiamodescrivendo l’insieme (−∞,

√2].

2. Usando le rispettive tavole di verità, si verifica in pochi istanti chep⇒ q è logicamente equivalente a (∼ p)∨ q. A parole, affermare che pimplica q significa affermare che o l’ipotesi p è falsa, oppure che è verala tesi q. In particolare, l’implicazione ⇒ non è un concetto primitivo,alla pari di ∧ e ∨.

Page 12: lezioni di matematica

4 CAPITOLO 1. INSIEMI E FUNZIONI

3. Descriviamo il complementare dell’insieme

E = {x ∈ Z | x è dispari e ex ≤ 7}.

Posto p(x) = (“x è dispari”) e q(x) = (“ex ≤ 7”), osserviamo che E ={x ∈ Z | p(x) ∧ q(x)}. Quindi il suo complementare è, per definizione,Z \ E = {x ∈ Z |∼ p(x) ∧ q(x)} = {x ∈ Z | (∼ p(x)) ∨ (∼ q(x))} ={x ∈ Z | x è pari oppure ex > 7}. Poiché log 7 ≈ 1.9, abbiamo unadescrizione esplicita del complementare:

Z \ E = {x ∈ Z | x è pari} ∪ (Z ∩ [2,+∞)).

4. Vogliamo negare la proposizione “Per ogni numero reale ε > 0 esiste unnumero reale δ > 0 tale che la propriet à P è vera”. Seguendo le regoledi negazione dei quantificatori, possiamo concludere che la negazionedi questa proposizione è “Esiste un numero reale ε > 0 tale che perogni numero reale δ > 0 la proprietà P è falsa”. Nel seguito avremooccasione di applicare questo ragionamento abbastanza spesso.

Lo studente interessato ad approfondire la logica elementare e il calcoloproposizionale, può consultare il primo capitolo del libro [20].

1.2 Richiami di insiemisticaUn noto proverbio recita Chi ben comincia ha la metà dell’opera.2 È un modogentile per sostenere che la parte più difficile di ogni impresa è l’inizio; il restoverrà da sé. L’apprendimento dela matematica non fa eccezione a questaregola, e addirittura si prendono delle scorciatoie. Alle scuole elementaritutti noi abbiamo imparato a fare i conticini, ma forse nessuno ha imparatola definizione di numero.

Anche il concetto di insieme è considerato, nella matematica elementare,come un concetto primitivo. Questo significa che non faremo alcuno sforzoper definirlo in termini di altri concetti già noti. Brevemente, un insieme saràper noi un raggruppamento3 di oggetti di natura ben specificata. Parleremopertanto dell’insieme delle automobili di colore rosso, come pure dell’insiemedei gatti dagli occhi verdi.

Nota linguistica. Nelle principali lingue neolatine il sostantivo per indi-care l’insieme matematico ha lo stesso significato doppio che ha in italiano.

2È forse più diffusa la versione in italiano moderno Chi ben comincia, è a metàdell’opera.

3Oppure una collezione.

Page 13: lezioni di matematica

1.2. RICHIAMI DI INSIEMISTICA 5

Infatti, si usa conjunto in spagnolo, ensemble in francese, insieme in italia-no. Questo si rispecchia nel significato intuitivo che un insieme è proprioun raggruppamento di oggetti, che sono “messi insieme”. Il rumeno si disco-sta leggermente con mulţime, chiaramente indicativo di una moltitudine dioggetti. In inglese, invece, si usa il sostantivo set, e si parla di set theory.Qui si coglie una sfumatura più pragmatica, come a voler sottolineare che uninsieme è qualcosa che viene organizzato, disposto, quasi “pronto all’uso”.

È consuetudine4 denotare gli insiemi con lettere maiuscole dell’alfabetolatino:

A,B,C,X, Y, Z, . . .

Come detto, ogni insieme è formato dai suoi elementi, di qualunque naturaessi siano. In matematica, l’appartenenza di x all’insieme X è indicato dalsimbolo

x ∈ X.Quindi, per ogni insieme X, risulta che5

X = {x | x ∈ X}.

Il fatto che l’elemento x non appartiene all’insieme X, si esprime scrivendo

x /∈ X.

Allo studente dovrebbero essere familiari le operazioni elementari sugliinsiemi, cioè l’unione, l’intersezione, il complementare di insiemi. Ricordiamoche

X ∪ Y = {x | x ∈ X oppure x ∈ Y }X ∩ Y = {x | x ∈ X e x ∈ Y }

Xc = {x | x /∈ X}X \ Y = {x | x ∈ X e x /∈ Y }.

Vogliamo chiarire che la congiunzione “oppure” viene usata dai matemati-ci in senso lato: x ∈ X ∪ Y significa che x appartiene ad almeno uno deidue insiemi X ed Y , ed eventualmente ad entrambi. Nella lingua italiana,l’affermazione “esco oppure resto a casa” è interpretata in maniera esclusi-va, essendo piuttosto improbabile che io possa essere contemporaneamente

4In certi settori della matematica, capita di denotare un insieme con una letteraminuscola o addirittura con lettere di alfabeti non latini.

5la sbarra verticale |, spesso sostituita dai due punti, si legge “tali che”. Quindi lascrittura seguente si legge “X è l’insieme degli elementi x tali che x appartiene ad X”.

Page 14: lezioni di matematica

6 CAPITOLO 1. INSIEMI E FUNZIONI

dentro e fuori casa. A volte può capitare di dover scrivere proprio un’unioneesclusiva, e in matematica si usa la scrittura

X∆Y = {x | x appartiene a X o a Y ma non ad entrambi}= (X ∪ Y ) \ (X ∩ Y ).

Il fatto che gli elementi di un insieme E appartengano anche a un (altro)insieme X si scrive

E ⊂ X oppure X ⊃ E.

Osservazione 1.7. A scanso di equivoci, sottolineiamo che, per noi, scrivereE ⊂ X non esclude affatto che E = X. Alcuni testi usano il simbolo ⊂ insenso esclusivo, mentre usano E ⊆ X per dire quello che noi diciamo conE ⊂ X. Si tratta di convenzioni, e crediamo che il lettore di questi appuntinon avrà mai occasione per rimpiangere le convenzioni adottate.

Probabilmente meno nota è la costruzione del prodotto cartesiano di dueinsiemi. Nel nostro corso non avremo grandi occasioni di farne uso, mapreferiamo spendere qualche parola visti i legami con il piano cartesiano.

Definizione 1.8. Dati due insiemi X ed Y , il loro prodotto cartesiano X×Yè l’insieme i cui elementi sono coppie ordinate del tipo (x, y) dove x ∈ X edy ∈ Y .

L’aggettivo “ordinate” si riferisce alla seguente proprietà: due coppie (x, y)e (x′, y′) sono uguali se e solo se x = x′, y = y′.

Lo studente che volesse approfondire ulteriormente le problematiche dellamoderna teoria degli insiemi, può riferirsi all’appendice di [19].

1.3 Insiemi numericiDurante lo studio del nostro corso, lo studente si imbatterquasi esclusiva-mente con insiemi di numeri. Ci sembra utile richiamare brevemente laterminologia dei principali insiemi numerici.

L’insieme dei numeri naturali, i primi numeri che l’uomo ha utilizzatonella vita quotidiana, è indicato dal simbolo N. Pertanto,6

N = {0, 1, 2, 3, 4, 5, 6, . . . }.6Alcuni libri di testo preferiscono escludere lo zero 0 da N. È una scelta supportata

solo dal proprio gusto.

Page 15: lezioni di matematica

1.3. INSIEMI NUMERICI 7

Se a questi numeri aggiungiamo anche i numeri negativi, otteniamo l’insiemedei numeri interi relativi Z, cioè

Z = {. . . ,−5,−4,−3,−2,−1, 0, 1, 2, 3, 4, 5, . . . }.

La necessità di dividere fra loro dei numeri interi relativi ha spinto a costruireun insieme più capiente di numeri, detti numeri razionali. Precisamente,

Q =

{p

q| p, q ∈ Z, q 6= 0

}.

Daremo per scontati i discorsi sulla possibilità di scrivere lo stesso numerorazione in infiniti modi diversi, sulla riduzione delle frazioni ai minimi termini,e così via.7 L’ultimo insieme numerico che introduciamo, è anche quellopiù importante. Purtroppo, la sua costruzione non è affatto elementare, néè possibile specificare semplicemente che cosa occorra aggiungere a Q perottenerlo. Si tratta dell’insieme dei numeri reali R. Possiamo pensare aR come all’insieme dei punti di una retta.8 Nonostante questa difficoltàtecnica, i numeri reali sono ormai parte integrante della cultura di qulunquestudente delle scuole superiori. È un dato di fatto che l’uso dei numeri realiè di facilissimo apprendimento, senza dubbio agevolato dalla diffusione dellecalcolatrici tascabili negli ultimi vent’anni. Gli sparuti studenti interessati acapire meglio come nascano rigorosamente i numeri reali, possono consultareuno dei testi indicati in bibliografia, ad esempio [3, 6].

Non ci sembra il caso di insistere sul fatto che9

N ⊂ Z ⊂ Q ⊂ R.

Nell’affrontare la teoria dei limiti, ci sarà utile la seguente proprietà dei nu-meri naturali rispetto ai numeri reali. La dimostrazione può essere lettain [24].

7Algebricamente, Q è il primo insieme numerico, a parte l’ovvietà della costruizione diZ, costruibile in maniera elementare ma non banale. Precisamente, i numeri razionali sonodelle classi di equivalenza di coppie ordinate di numeri interi con segno. Se lo studentenon ha capito nemmeno una parola dell’ultima frase, non è grave. In parole povere, lafrazione 1/2 è la coppia ordinata (1, 2), e il fatto che 1/2 = 2/4 = 3/6 = . . . si rispecchianell’introduzione di una “regola”, la relazione di equivalenza, che considera uguali le coppie(1, 2), (2, 4), (3, 6), ecc.

8Già quarant’anni fa, Walter Rudin osservava nella prefazione del suo libro [24] che lamaggior parte degli studenti non sente la necessità di costruire l’insieme dei numeri reali,almeno in prima battuta.

9In realtà, non si tratta di vere inclusioni insiemistiche; piuttosto dovremmo parlare diimmersioni.

Page 16: lezioni di matematica

8 CAPITOLO 1. INSIEMI E FUNZIONI

Proposizione 1.9 (Proprietà archimedea dei numeri reali). Per ogni y ∈ Red ogni x > 0 reale, esiste n ∈ N tale che nx > y.

Per i nostri scopi, applicheremo quasi esclusivamente il seguente

Corollario 1.10. Per ogni numero reale x > 0, esiste un numero naturalen tale che n > x.

Dim. Ovviamente è una conseguenza diretta della Proposizione precedente.Però si dimostra anche in modo elementare: immaginiamo che x sia scrittonella sua espansione decimale, e “arrotondiamolo” al numero intero n succes-sivo. Per esempio, se x = 1475.1234567, lo arrotondiamo a n = 1476. Questonumero naturale n è quello cercato.

Una proprietà meno nota dei numeri reali è la seguente.

Proposizione 1.11. Fra due numeri reali qualsiasi e distinti, cade sempreun numero razionale.

Non esponiamo la dimostrazione di questo fatto, che il lettore interessatopotrà studiare in [24]. Ci limitiamo ad osservare che da questa proposizionederiva la possibilità di approssimare, con errore scelto a piacere, ogni numeroreale con un numero razionale. Infatti, sia x un numero reale, e sia ε > 0l’errore con cui vogliamo approssimare x mediante un numero reale. DallaProposizione precedente, applicata ai due numeri reali distini x− ε e x + ε,deduciamo c he esiste un numero razionale q tale che x − ε ≤ q ≤ x + ε.Pertanto |x− q| ≤ ε, come volevasi dimostrare.

Nota tipografica: simboli altrettanto diffusi per denotare i precedentiinsiemi numerici sono N, Z, Q e R.

Concludiamo questo paragrafo con alcune considerazioni sul valore asso-luto di un numero reale.

Definizione 1.12. Il valore assoluto (spesso detto anche modulo) di unnumero reale x è definito come

|x| =

{x, se x ≥ 0

−x, se x < 0

Operativamente, la definizione del valore assoluto di un qualsiasi numeroreale x è basata sul controllo del segno di x. Se x è positivo o nullo, vienerestituito il valore x. Se x è negativo, viene restituito il valore −x. Qualchevolta si trova scritto che “|x| è il numero x, senza segno”. Questa affermazioneè suggestiva ma priva di senso: tutti i numeri reale hanno un segno!

Page 17: lezioni di matematica

1.3. INSIEMI NUMERICI 9

Lemma 1.13. Per ogni x, y, z ∈ R, vale la disuguaglianza triangolare

|x− y| ≤ |x− z|+ |z − y|. (1.1)

Dim. Basta dimostrare che, per ogni a, b ∈ R, vale la disuguaglianza

|a+ b| ≤ |a|+ |b|. (1.2)

Infatti, scegliendo a = x−z e b = z−y, da questa segue subito |x−z+z−y| =|x− y| ≤ |x− z|+ |z − y|, che è la tesi. Siano quindi a e b due numeri realiqualunque. Distinguiamo vari casi.

1. Se a = 0 oppure b = 0, la tesi è ovvia.

2. Se a > 0 e b > 0, allora a+b ≥ 0. Vogliamo dimostrare che a+b ≤ a+b,ma questo è ovvio.

3. Se a < 0 e b < 0, allora a + b < 0. Pertanto vogliamo dimostrare che|a+ b| = −a− b ≤ −a− b, e ancora una volta questa relazione è ovvia.

4. Se i due numeri a e b sono l’uno positivo e l’altro negativo, a primomembro di (1.2) abbiamo la differenza fra due numeri positivi, e asecondo membro abbiamo la loro somma. Ovviamente il primo membroè minore del secondo.

Avendo verificato la tesi in tutti i casi possibili, la dimostrazione è completa.

Concludiamo con qualche informazione sulle diseguaglianze che coinvol-gono i valori assoluti. Lo studente apprezzerà queste informazioni leggendoil capitolo sui limiti.

Lemma 1.14. Per ogni ε > 0,

{x ∈ R : |x| ≤ ε} = {x ∈ R : −ε ≤ x ≤ ε}{x ∈ R : |x| ≥ ε} = {x ∈ R : x ≤ −ε} ∪ {x ∈ R : x ≥ ε}

Dim. Dimostriamo la prima uguaglianza. Essendo un’uguaglianza fra dueinsiemi, occorre dimostrare la doppia inclusione. Sia dunque x un numeroreale tale che |x| ≤ ε. Questo vuol dire che x ≤ ε se x ≥ 0, e che −x ≤ ε sex < 0. Nel primo caso, 0 ≤ x ≤ ε, nel secondo −ε ≤ x < 0. L’insieme delle“soluzioni” sarà l’unione di queste condizioni, cioè −ε ≤ x ≤ ε. Abbiamodimostrato che

{x ∈ R : |x| ≤ ε} ⊂ {x ∈ R : −ε ≤ x ≤ ε}

Page 18: lezioni di matematica

10 CAPITOLO 1. INSIEMI E FUNZIONI

Viceversa, sia x un numero reale tale che −ε ≤ x ≤ ε. Allora |x| è un numeroreale, non negativo, non superiore a ε. Quindi

{x ∈ R : |x| ≤ ε} ⊃ {x ∈ R : −ε ≤ x ≤ ε}

e pertanto i due insiemi a primo e a secondo membro coincidono. Lasciamoallo studente la verifica della seconda uguaglianza, imitando i ragionamentiappena visti.

Passando dai simboli alle parole, il Lemma precedente ci dice che larelazione

|x| ≤ ε

equivale a−ε ≤ x ≤ ε.

Similmente, la relazione|x| ≥ ε

equivale ax ≤ −ε oppure x ≥ ε.

Osservazione 1.15. Occorre fare attenzione quando si utilizzano quantitàaribitrarie. Ad esempio, se x è un numero reale tale che |x| < ε per ogniε > 0, allora x = 0. Se infatti x fosse diverso da zero, allora potremmoscegliere ε = |x|/2 e avremmo la contraddizione |x| ≥ ε. A parole, stiamodicendo che l’unico numero non negativo arbitrariamente piccolo è lo zero.

1.4 Topologia della retta reale

In questa breve sezione, il lettore vedrà delle idee e dei simboli certamente giànoti fin dalle scuole medie. Eppure, dubitiamo che i professori delle scuolemedie gli abbiano mai parlato di topologie. La topologia10 è un ramo dellamatematica che si occupa di studiare in astratto il concetto di “forma”. Inche senso possiamo deformare un oggetto di gomma, cambiandone l’aspettoesteriore, senza però dire che si rtatta di un oggetto differente? A questa ead altre domande tenta di rispondere proprio la topologia. Ovviamente, inostri numeri reali sono un caso molto particolare di “spazio topologico”, enoi ci accontenteremo di formalizzare alcuni concetti utili nel resto del corso.

10Dal greco topos e logos, dunque “conoscenza della forma”.

Page 19: lezioni di matematica

1.4. TOPOLOGIA DELLA RETTA REALE 11

Definizione 1.16. Siano a e b due numeri reali. Diciamo che a < b (a èminore di b) se b− a è un numero positivo. Se b− a è un numero negativo,diremo al contrario che a > b. Il simbolo a ≤ b indica il fatto che b − a èpositivo oppure zero, e analogamente a ≥ b. 11

Definizione 1.17. Sia E ⊂ R un sottoinsieme dei numeri reali. Un numeroM ∈ R è un maggiorante per E se

x ≤M per ogni x ∈ E.

Analogamente, un numero m ∈ R è un minorante per E se

x ≥ m per ogni x ∈ E.

Un insieme E di numeri reali è limitato dall’alto se possiede un maggiorante,mentre è limitato dal basso se possiede un minorante.

Per esempio, N è limitato dal basso poiché ogni numero naturale è mag-giore o uguale a zero. Tuttavia N non è limitato dall’alto, perché esistononumeri naturali grandi quanto vogliamo.

Definizione 1.18. Sia E un sottoinsieme di R, limitato dall’alto. L’estremosuperiore di E, denotato con

supE,

è definito come il più piccolo di tutti i maggioranti di E. Analogamente,l’estremo inferiore di E,

inf E,

è definito come il più grande di tutti i minoranti di E.

Osservazione 1.19. In generale, inf E e supE non appartengono ad E. Siconfronti con la definizione di minimo e massimo nelle prossime pagine.

Sarà comodo, nel seguito, usare delle notazioni meno rigide per inf e sup.Ad esempio, scriveremo

infn∈N

1

n= 0

invece diinf

{1

n| n ∈ N

}= 0.

11Questa definizione, a pensarci bene, fatica a stare in piedi. Come definire un numeropositivo x, se non chiedendo che x > 0? È un circolo vizioso. Tuttavia, speriamo che lostudente sappia distinguere un numero positivo da uno negativo in maniera quasi inconscia.

Page 20: lezioni di matematica

12 CAPITOLO 1. INSIEMI E FUNZIONI

La prima notazione, che sembra interpretare inf come un’operazione sui nu-meri invece che sugli insiemi, fa il paio con la notazione per le unioni e leintersezioni di insiemi. Infatti, se A1, A2 e A3 sno tre insiemi qualsiasi, siscrive

3⋃i=1

Ai

invece di ⋃{A1, A2, A3} =

⋃{Aj | i ∈ {1, 2, 3}} .

Queste notazioni abbreviate hanno qualche risvolto curioso. Se E è uninsieme di numeri reali, la scrittura

supx∈E

x

coincide in tutto e per tutto con supE, ma questa volta non possiamo direche sia preferibile. Ne traiamo una morale: le notazioni con il pedice sonopreferibili quando l’insieme su cui agiscono inf e sup hanno una descrizionedi tipo “funzionale” {f(x) | x ∈ E}. Per un approfondimento delle notazioniinsiemistiche, consigliamo il libro di P. Halmos [15] e quello di J. Kelley [19].In quest’ultimo si suggerisce anche la notazione

Ex∈R

(x2 < 1

)per significare l’insieme {x ∈ R | x2 < 1}. Possiamo ritenerci fortunati chequesta notazione non abbia mai preso piede!

Lemma 1.20. M ∈ R è l’estremo superiore di E se e solo se

1. M ≥ x per ogni x ∈ E;

2. per ogni ε > 0 esiste x ∈ E tale che M − ε ≤ x ≤M .

Una caratterizzazione analoga vale per l’estremo inferiore.

Lemma 1.21. m ∈ R è l’estremo inderiore di E se e solo se

1. m ≤ x per ogni x ∈ E;

2. per ogni ε > 0 esiste x ∈ E tale che m ≤ x ≤ m+ ε.

Non dimostriamo in questi appunti i due lemmi precedenti. Spendiamoqualche parola sul loro significato. Il primo, ad esempio, ci dice che l’estremosuperiore di un sottoinsieme E di R è quel numero M che innanzitutto è unmaggiorante. E, in secondo luogo, ci devono essere elementi di E vicini apiacere a M .

Page 21: lezioni di matematica

1.5. L’INFINITO 13

Definizione 1.22. Sia E un sottoinsieme limitato (dall’alto e dal basso) diR, e poniamo m = inf E, M = supE. Diciamo che m è il minimo di E sem ∈ E, e che M è il massimo di E se M ∈ E.

Notiamo che questa definizione non è superflua. Nessuno ci garantisceche l’estremo superiore di un insieme sia un elemento di tale insieme. Ingenerale, è solo un numero reale. Quindi, l’estremo superiore diventa il mas-simo esattamente quando appartiene all’insieme in considerazione. Similiconsiderazioni valgono ovviamente per l’estremo inferiore.

Definizione 1.23. Siano a < b due numeri reali. Gli insiemi

(a, b) = {x ∈ R | a < x < b}[a, b] = {x ∈ R | a ≤ x ≤ b}[a, b) = {x ∈ R | a ≤ x < b}(a, b] = {x ∈ R | a < x ≤ b}.

si chiamano rispettivamente intervallo aperto, chiuso, chiuso a sinistra, chiu-so a destra, di estremi a e b.

Osservazione 1.24. Per ricordare queste definizioni, possiamo dire che laparentesi quadra corrisponde ad un estremo compreso, mentre quella tondacorrisponde ad un estremo escluso. Alcuni libri usano la notazione ]a, b[ alposto di (a, b), ecc.

Definizione 1.25. Sia x0 ∈ R un numero reale fissato. Si chiama intornodi x0 qualunque intervallo aperto (a, b) tale che x ∈ (a, b).

Quindi ogni numero reale possiede infiniti intorni. Spesso conviene uti-lizzare intorni simmetrici, della forma (x0 − δ, x0 + δ), dove δ > 0 si chiamaraggio dell’intorno.

Esercizio. Invitiamo lo studente a dimostrare che, se E = (a, b), allorainf E = a, supE = b. Inoltre, inf[a, b) = a = min[a, b), e sup[a, b) = b, ma bnon è il massimo di [a, b).

1.5 L’infinitoNello studio dell’analisi matematica, lo studente si imbatte in un concettoassolutamente nuovo: quello di infinito. Mentre Algebra e Geometria ele-mentari si occupano di quantità finite (numeri, rette, piani, ecc.), l’Analisi

Page 22: lezioni di matematica

14 CAPITOLO 1. INSIEMI E FUNZIONI

vuole formalizzare l’idea vaga di avvicinarsi indefinitamente a qualcosa. In-troduciamo in questa sezione, secondo una logica assai pratica, il simbolo ∞e il suo significato.

Definizione 1.26. Per i nostri scopi, ∞ è un simbolo privo di significatonumerico.

Invitiamo il lettore a trattenere il sorriso sarcastico che la definizioneprecedente potrebbe generare.12 Chiunque abbia studiato per qualche tempola filosofia antica e medioevale ricorda certamente gli sforzi e le acrobaziemessi in atto dai pensatori per motivare il conceto di infinito: qualcosa senzalimiti spaziali o temporali, addirittura un ente metafisico vicino alla divinità.

Nell’economia del nostro corso, non serve definire rigorosamente il simbo-lo ∞. A noi interessa piuttosto usare ∞ come abbreviazione per esprimereconcetti già noti. Si tratta dunque di stipulare opportune convenzioni nellequali ∞ è una mera abbreviazione tipografica, quasi un simbolo stenografi-co. Per esempio, se un insieme E ⊂ R non è limitato dall’alto, si conviene discrivere

supE = +∞.e se E non è limitato dal basso,

inf E = −∞.

In particolare, +∞ sembra nascondere l’idea di muoversi indefinitamenteverso destra lungo la retta (orientata) dei numeri reali. Per analogia, −∞significa in qualche senso muoversi indefinitamente verso sinistra su tale retta.Vogliamo però mettere in guardia lo studente dal compiere un errore fra i piùfrequenti ed ingenui: +∞ e −∞ non sono numeri reali ! In particolare, adessi non si applicano le consuete operazioni algebriche di somma, sottrazione,moltiplicazione e divisione.13

Vogliamo tuttavia ricordare che la Matematica moderna introduce il con-cetto di infinito anche con significati diversi. In Geometria Proiettiva e inAnalisi Complessa si parla altrettanto spesso di infinito, sebbene da un puntodi vista più geometrico.

Osservazione 1.27. Molti libri introducono la cosiddetta retta reale estesaR = R∪{−∞}∪{+∞}, ottenuta aggiungendo ai consueti numeri reali i due

12Chi scrive, ricorda una definizione sul proprio libro di Algebra, in cui si diceva “...dove x è un simbolo al quale non attribuiremo alcun significato”.

13Sappiamo che qualche studente più esperto potrebbe dire che, con i limiti, si fannole operazioni su ∞. Questo è parzialmente vero, e in certe discipline conviene definire0 · ∞ = 0. L’esistenza delle forme di indecisione ci lascia però intendere che in questadefinizione il simbolo∞ ha un significato diverso da quello che gli abbiamo finora attibuito.

Page 23: lezioni di matematica

1.6. PUNTI DI ACCUMULAZIONE 15

infiniti dotati di segno. Ovviamente, si richiede che, per ogni numero realex,

−∞ < x < +∞.È possibile una (parziale) aritmetizzazione di R estendendo le quattro ope-razioni: per ogni x ∈ R si definisce

x+∞ = +∞, x−∞ = −∞+∞+∞ = +∞, −∞−∞ = −∞

e

x · (+∞) =

{+∞ se x > 0

−∞ se x < 0,x · (−∞) =

{−∞ se x > 0

+∞ se x < 0,

(+∞) · (+∞) = +∞, (+∞) · (−∞) = −∞, (−∞) · (−∞) = +∞Non si dà invece alcun senso alle scritture

+∞−∞, −∞+∞.

Il caso 0·(±∞) è particolare: esistono settori della matematica in cui convieneporre 0 · (±∞) = 0, ad esempio la Teoria della Misura. Nell’Analisi Mate-matica elementare, è opportuno evitare di definire questo prodotto, poichécreerebbe pericolose confusioni al calcolo dei limiti. Per uno studente di unprimo corso di matematica, l’uso della retta reale estesa non presenta parti-colari utilità, e nel resto delle dispense non utilizzeremo mai questo ambientenumerico.

1.6 Punti di accumulazioneIntroduciamo un concetto che appartiene di diritto alla matematica modernae che permette notevoli semplificazioni nei discorsi che faremo più avanti.

Definizione 1.28. Sia E un sottoinsieme di R. Diremo che il punto x0 ∈ Rè un punto di accumulazione per l’insieme E se, preso un qualsiasi intornoI di x0, si verifica che (I \ {x0}) ∩ E 6= ∅. A parole, ogni intorno I di x0

contiene un punto di E, diverso da x0.

Per esempio, il punto x0 = 0 è di accumulazione per

E =

{1,

1

2,1

3,1

4, . . . ,

1

n, . . .

}.

Infatti, sia I = (a, b) un intorno di 0; in particolare a < 0. Scegliamo nnaturale tale che 1/n < b. Perciò 1/n ∈ I ∩ E, e poiché 1/n 6= 0 abbiamo

Page 24: lezioni di matematica

16 CAPITOLO 1. INSIEMI E FUNZIONI

verificato la nostra affermazione. Lo studente potrà verificare senza sforzoche i punti di accumulazione per un intervallo chiuso qualsiasi [a, b] sono tuttie soli i punti di [a, b]. Invece, i punti di accumulazione di un intervallo aperto(a, b) sono i punti di [a, b] (ci sono anche i punti a e b!).

Un esempio di natura opposta è il seguente. L’insieme N ⊂ R non possie-de punti di accumulazione. Infatti, se scegliamo un qualsiasi numero naturalen ∈ N, l’intorno I = (n− 1/2, n + 1/2) non contiene alcun numero naturalead eccezione di n stesso. Per mettere ulteriormente in luce il senso dell’esclu-sione del punto x0 nella definizione di punto di accumulazione, consideriamol’insieme E = {0} ∪ (1, 2). A parole, E è composto dal singolo punto 0 edall’intervallo aperto (1, 2). Domanda: quali sono i punti di accumulazionedi E?

La risposta è che i punti di accumulazione di E sono esattamente i puntidell’intervallo [1, 2]. Infatti, il punto “isolato” 0 non può essere di accumula-zione, visto che ogni suo intorno (−δ, δ) con δ < 1 interseca E solo nel punto0 stesso.

Può essere utile, in certi casi, adattare al simbolo∞ alcuni concetti propridei punti al finito. Ad esempio, un intorno di +∞ è un qualsiasi intervallodella forma (a,+∞), e similmente un intorno di −∞ è un qualsiasi intervallodella forma (−∞, b). Lasciamo allo studente il seguente spunto di riflessione:se E è un sottinsieme di R, quando +∞ è un punto di accumulazione per E?E quando lo è −∞? Le risposte sono abbastanza semplici. In particolare,lo studente si convincerà che +∞ è un punto di accumulazione per E = N,l’insieme dei numeri naturali.

1.7 Appendice: la dimostrazione per induzione

Nello studio del calcolo, si incontrano spesso identità e formule che coinvolo-gno i numeri naturali. Cerchiamo di formalizzare un metodo di dimostrazionevalido in queste situazioni.

Supponiamo che, per ogni valore dell’indice naturale n, P (n) sia unaproposizione logica. Supponiamo inoltre di poter dimostrare le seguentiaffermazioni:

1. esiste n0 ∈ N tale che P (n0) è vera;

2. Se è vera P (n), allora è vera anche P (n+ 1).

Le proprietà dell’insieme N dei numeri naturali permettono di dimostrare chela proposizione P (n) è allora vera per ogni n ≥ n0.

Page 25: lezioni di matematica

1.7. APPENDICE: LA DIMOSTRAZIONE PER INDUZIONE 17

A parole, per dimostrare la validità di un’affermazione per ogni n natu-rale, basta dimostrarla per n = 1, e poi dimostrare che la validità di P (n)implica la validità di P (n + 1). Cerchiamo di chiarire il concetto con unesempio.

Esempio: la disuguaglianza di Bernoulli. Dimostriamo che

(1 + x)n ≥ 1 + nx, per ogni x > −1 e per ogni n ∈ N.

Procediamo per induzione sul numero naturale n. Per n = 1, dobbiamodimostrare che 1 + x ≥ 1 + x, il che è palesemente vero. Supponiamo che ladisuguaglianza sia vera per n, e dimostriamo che deve essere vera anche pern+ 1. Quindi, per ipotesi,

(1 + x)n ≥ 1 + nx, per ogni x > −1 e per ogni n ∈ N.

Che cosa dobbiamo dimostrare? Scriviamo n+ 1 al posto di n nella disugua-glianza di Bernoulli, e troviamo

(1 + x)n+1 ≥ 1 + (n+ 1)x.

Questo è il nostro obiettivo. Ma (1 + x)n+1 = (1 + x)n(1 + x) ≥ (1 +nx)(1 +x) = 1 +x+nx+nx2 ≥ 1 +x+nx = 1 + (n+ 1)x. Osserviamo che abbiamousato la validità della disuguaglianza per n e abbiamo trascurato il terminenx2 ≥ 0 nell’ultimo passaggio. Il principio di induzione garantisce allora chela disuguaglianza di Bernoulli è sempre vera.14

Esempio: somme di quadrati. Vogliamo dimostrare l’identità15

n−1∑k=1

k2 =n(n− 1)(2n− 1)

6. (1.3)

Procediamo per induzione su n. Per n = 2,16 l’identit à si riduce a

12 =2 · 1 · 3

6= 1.

14La condizione x > −1 è stata usata nel passaggio (1 + x)n(1 + x) ≥ (1 + nx)(1 + x).Se il termine 1 + x fosse negativo, dovremmo invertire il senso della disuguaglianza, e ilragionamento perderebbe validità.

15L’estremo superiore n− 1 appare in questa forma perché ci servirà in un esempio nelcapitolo sull’integrale di Riemann.

16Poiché l’estremo n− 1 della somma deve essere almeno pari a quello inferiore, occorrechiedere che n− 1 ≥ 1, cioè n ≥ 2.

Page 26: lezioni di matematica

18 CAPITOLO 1. INSIEMI E FUNZIONI

Supponiamo che l’identità sia vera per n, e dimostriamo che deve essere veraanche per n+ 1. Per n+ 1, il primo membro di (1.3) diventa

n∑k=1

k2 =n−1∑k=1

k2 + n2,

e sfruttando l’ipotesi per n possiamo scrivere

n∑k=1

k2 =n−1∑k=1

k2 + n2 =n(n− 1)(2n− 1)

6+ n2.

Se togliamo le parentesi a secondo membro e mettiamo a denominatorecomune, troviamo dopo qualche passaggio elementare

n(n− 1)(2n− 1)

6+ n2 =

n(n+ 1)(2n+ 1)

6,

espressione che coincide con il secondo membro di (1.3) in cui n è rimpiazzatoda n+1. Questo significa esattamente che la nostra identità continua a valereanche per n+ 1, e dunque il procedimento per induzione è terminato.17

17La prima curiosità di molti studenti è chi abbia “indovinato” l’identità (1.3). Infat-ti, la dimostrazione per induzione non è costruttiva, e non serve a dedurre quanto valga∑n−1k=1 k

2. Se nessuno ci scrivesse la formula, per induzione non riusciremmo mai a rico-struirla. Questo tipo di formule erano il divertimento di matematici del calibro di F. Gauss,che era solito calcolarle da bambino, mentre il maestro spiegava un’aritmetica evidente-mente troppo noiosa. Nel libro di M. Spivak, Calculus, c’è un esercizio del primo capitoloche suggerisce un metodo costruttivo per calcolare somme finite come quella appena vista.

Page 27: lezioni di matematica

Capitolo 2

Funzioni fra insiemi

Ora che abbiamo conquistato una certa familiarità con il linguaggio degliinsiemi, rivediamo rapidamente il linguaggio della teoria delle funzioni frainsiemi.

Definizione 2.1. Siano X ed Y due insiemi qualsiasi. Una funzione f : X →Y (si legge: f da X in Y ) è una legge che ad ogni x ∈ X associa precisamenteuno ed un solo elemento y ∈ Y , denotato anche con f(x). La notazionecompleta è

f : X → Y

x 7→ f(x)

Utilizzeremo sovente la notazione più compatta f : x ∈ X 7→ f(x) ∈ Y .L’insieme X si chiama dominio (di definizione) di f , mentre Y si chiamacodominio di f .

Notiamo che la definizione appena data nasconde una certa ambiguit à.Che cosa sarebbe una legge? In realtà, gli studenti del corso di Matematicaimparano fin dall’inizio una definizione più rigorosa di funzione. Quella cheabbiamo proposto ricalca la definizione ingenua delle scuole superiori, e siaffida all’idea innata di legge che permette di mettere in corrispondenza dueelementi di due insiemi noti.

Purtroppo la definizione rigorosa richiederebbe l’introduzione di ulterioriconcetti che non verrebbero più utilizzati nel nostro corso. Riportiamo ilseguente commento, tratto da [1].

Possiamo pensare una funzione f : X → Y come una specie discatola nera, con un ingresso e un’uscita. Ogni volta che in in-gresso entra un elemento del dominio, la scatola nera – la funzione

19

Page 28: lezioni di matematica

20 CAPITOLO 2. FUNZIONI FRA INSIEMI

– lo elabora e poi emette dall’uscita un elemento del codominio.Non è importante la natura degli elementi del dominio e del codo-minio (possono essere numeri, rette, patate, cavalleggeri prussianio qualsiasi altra cosa) né il tipo di processi digestivi che avven-gono all’interno della scatola. Siano somme, prodotti, classificheo formine da sabbia, tutte è ammissibile purché il procedimentousato sia sempre lo stesso: ogni volta che in ingresso infiliamo lastessa patata, in uscita dobbiamo ottenere sempre la stessa cipol-la – ad ogni elemento del dominio viene associato uno ed un soloelemento del codominio, appunto.

Avvertenza. Molti studenti, ma anche molti docenti e qualche libro di testo,hanno l’abitudine di riferirsi “alla funzione f(x)” invece che “alla funzione f ”.Come abbiamo visto, una funzione è una legge, mentre f(x) è semplicementeil valore che f assume in x. Per fare un paragone, sarebbe come confonderela persona Simone Secchi con le dispense scritte da Simone Secchi.

Quindi non esiste la funzione sinx, né la funzione x2. Più corretto, esenz’altro più accettabile, è parlare della funzione x 7→ x2, indicata anchecon (#)2 in alcun i libri. Quest’ultima notazione, o l’equivalente (·)2, èampiamente tollerata. La scrittura (sin #)/# significherebbe “la funzionex 7→ (sinx)/x”, e quindi # assumerebbe il valore di carattere “jolly” per lavariabile indipendente. Sfortunatamente, questa notazione è comune in moltilibri avanzati come [9], ma non ha mai fatto breccia nella tradizione dei testielementari.1

Lo studente, a regola, non capisce perché occorra perdere tempo in questedisquisizioni, che non giovano molto alla sua premura di superare l’esamefinale. Lasciando da parte il doveroso rimprovero a chi crede che gli esamiuniversitari siano inutili scocciature da superare balbettando qualche frasedavanti al professore, stiamo parlando di un concetto veramente profondo. Lax non è una divinità, nessun medico ce ne prescrive l’uso, e solo la tradizioneinvoglia a usare tale lettera per la variabil e indipendente.2 Le due scritturex 7→ ex e ζ 7→ eζ denotano la stessa funzione: x e ζ, ma potremmo usare α, ρo anche z, sono soltanto simboli. Una celebre battuta dice che, in matematica,un cappello rosso non è necessariamente un cappello, e anche se lo fosse nonsarebbe necessariamente rosso. Quello che conta veramente è il significatoattribuito ai simboli, nel nostro caso la legge, cioè la funzione, alla quale talisimboli vengono sottoposti. In alcuni contesti avanzati, la “funzione f(x)”

1Purtroppo, la tendenza a confondere ciò che un soggetto è con ciò che quel soggettofa, è un errore sempre più diffuso anche nella nostra società.

2I fisici preferiscono usare t, come se parlassero di un tempo.

Page 29: lezioni di matematica

21

potrebbe anche indicare il nome di una funzione che agisce come

f(x) : t 7→ f(x)(t).

Sembra un paradosso, ma non lo è, ed anzi tali notazioni sono pressochéobbligatorie in Geometria Differenziale e in Analisi Funzionale. Domandaprovocatoria per lo studente: chi parlerebbe della funzione g(1/2)? Se xdenota un numero, g(1/2) dovrebbe essere tanto legittimo quanto g(x)...

Per amore di verità, molti docenti continuano a ritenere essenzialmente(o totalmente) corretta un’espressione come “sia f(x) una funzione conti-nua”. Seguendo la prassi italica che si fanno le regole e poi si tollerano letrasgressioni,3 i trasgressori non verranno perseguiti in sede d’esame.

Esempi. Siano X l’insieme di tutti gli uomini della Terra, e Y l’insiemedi tutti i colori. Se ad ogni uomo di X associamo il colore del suo occhiodestro,4 abbiamo costruito una funzione da X in Y .

Se X è l’insieme di tutte le scatolette di tonno di un certo negozio, eY è l’insieme dei numeri razionali Q, possiamo associare ad ogni x ∈ Xil suo prezzo y ∈ Q = Y , ottenendo una funzione. La scelta di Y = Qnasconde la presunzione che nessun negoziante ci farà mai pagare π euro peruna scatoletta di tonno. Sembra perciò ragionevole che i prezzi delle scatoledi tonno siano numeri con una quantità finita di numeri decimali, e dunquenumeri razionali.

Se infine X è l’insieme di tutte le circonferenze del piano cartesiano eY = R, possiamo associare ad ogni circonferenza il suo raggio. Anche questaè una funzione.

Scegliamo ora X = Y come l’insieme di tutti gli individui viventi sullaTerra. Associando ad ogni individuo vivente i suoi genitori, non definiamouna funzione: esistono gli orfani, e inotre potremmo associare a un x ∈ Xdue elementi di Y , madre e padre.

Nel seguito, useremo quasi esclusivamente insiemi numerici e funzioni fradi essi.

Definizione 2.2. Se f : X → Y è una data funzione, l’insieme

f(X) = {y ∈ Y | esiste x ∈ X tale che y = f(x)} ⊂ Y

si chiama immagine di X rispetto a f . Se invece V ⊂ Y , l’insieme

f−1(V ) = {x ∈ X | f(x) ∈ V }3Ogni riferimento socio–politico è pienamente voluto.4Ci sono esseri umani – pochi – con occhi di colori differenti, dunque parlare di “colore

degli occhi” non definirebbe una funzione. Escludiamo implicitamente gli individui prividell’occhio destro.

Page 30: lezioni di matematica

22 CAPITOLO 2. FUNZIONI FRA INSIEMI

si chiama controimmagine (o preimmagine, o ancora anti-immagine) dell’in-sieme V .

Il codominio Y è decisamente meno importante del dominio X. Effet-tivamente, per specificare una funzione, ci servono in maniera essenziale ildominio e la legge, mentre il codominio può essere “allargato” senza influiretroppo sulla funzione. Infatti, ciò che conta sembra essere f(X): gli elementidi Y che non sono immagini di elementi di X possono essere sacrificati inprima battuta. Oppure, potremmo aggiungere ulteriori elementi all’imma-gine, senza alterare la funzione. Invitiamo il lettore a ritornare sull’esempiodelle scatolette di tonno. È vero che i prezzi sono (ragionevolmente) numerirazionali, ma se avessimo scelto come codominio l’insieme dei numeri realinon avremmo compromesso la nostra funzione.

Convenzione didattica. Abbiamo appena detto che una funzione si com-pone di tre elementi: un dominio, un codominio, e una legge. Ogni studentesa già, però, che in certi esercizi si chiede di “trovare” il dominio di definizionedi una certa funzione, scritta solitamente f(x) = . . . È una richiesta pocochiara, a cui si conviene di attribuire un senso convenzionale molto chiaro.Quando si lavora con funzioni reali di una variabile reale, il dominio è intesocome il “dominio naturale”, cioè il più grande sottoinsieme di R in cui tuttele operazioni scritte nella formula di f hanno senso. Se f(x) =

√x− 1, il

dominio è l’insieme delle x tali che x−1 ≥ 0. Questo perché si può estrarre laradice quadrata solo di numeri maggiori o uguali a zero. Se f(x) = log(3x−1),il dominio è l’insieme delle x tali che 3x− 1 > 0, poiché solo i numeri stret-tamente positivi hanno un logaritmo. Chiedere di trovare il dominio di unadata funzione significa chi edere allo studente di ricordare quali sono i dominidi definizioni delle principali funzioni elementari, e di fargli risolvere alcunedisequazioni. È vero che f(x) = log x può essere legittimamente definitasul dominio [1, π], ma non si tratta del dominio naturale. Nel linguaggiointrodotto in questi appunti, sono semplicemente due funzioni diverse.

Osservazione 2.3. Una situazione che solitamente risulta insidiosa per glistudenti è il caso delle funzioni contenenti potenze in cui sia la base chel’esponente sono variabili. Ad esempio, qual è il dominio di definizione dix 7→ xx? O di x 7→ (sinx)log x? La risposta è che per definire un’espressionequale

f(x)g(x)

occorre imporre la condizione f(x) > 0. La ragione si capisce solo ricordandoquella teoria delle potenze che ormai non viene quasi più insegnata.

Page 31: lezioni di matematica

23

L’angolo dello smemorato: le potenze. Ricordiamo che, dato un qual-siasi numero reale (positivo, nullo o negativo) x, si definisce la sua potenzan– esima, per n ∈ N mediante la formula

xn = x · x · . . . · x (n fattori).

Indi, si definiscono le potenze con esponente intero relativo, dicendo che

x−n =1

xn.

Naturalmente, occorre richiedere che x 6= 0. I primi dubbi arrivano peresponenti razionali. Infatti, come definire x1/q, dove q ∈ N, q 6= 0? Di solitosi dice che

x1/q = y se e solo se x = yq.

Pertanto, bisogna distinguere fra q pari e q dispari. Nel primo caso, poichéogni numero elevato ad una potenza pari diventa non negativo, dovremoimporre x ≥ 0. Nel secondo caso, invece, ogni numero x ∈ R può essereelevato alla potenza 1/q, q dispari. Si pensi, per ricordarlo, alla radice cubicax1/3, definita per ogni x reale. Ad esempio, l’espressione x1/8 ha senso soloper x ≥ 0, mentre x1/17 è definita per ogni x reale.

Ultimo passaggio, il caso dell’esponente razionale qualunque: xp/q. Ov-viamente, possiamo pensare che la frazione p/q sia già ridotta ai minimitermini. Poniamo allora

xp/q = (xp)1/q

se p ≥ 0, mentre

xp/q =1

x−p/q

se p < 0. Ovviamente, dobbiamo controllare che le potenze scritte abbianosignificato: se q è un numero pari, (xp)1/q ha senso solo per xp ≥ 0, cioè perx ≥ 0. Se q è dispari, possiamo scrivere (xp)1/q per ogni x reale. Per p < 0,dobbiamo inoltre escludere x = 0 dalla definizione. Per esempio,

x2/3 = (x2)1/3,

definita dunque per ogni x reale (perché il denominatore 3 dell’esponente èdispari), mentre

x5/2 =(x5)1/2

definita solo per x ≥ 0 perché il denominatore 2 dell’esponente è un numeropari. Infine,

x−4/3 =1

x4/3,

Page 32: lezioni di matematica

24 CAPITOLO 2. FUNZIONI FRA INSIEMI

definita per ogni x 6= 0: l’unica condizione è infatti che il denominatore x4/3

sia diverso da zero.Dopo qusta lunga digressione, non è affatto chiaro come definire xα, per

un qualunque numero α ∈ R. La risposta è insita nella costruzione dell’in-sieme dei numeri reali.5 Ci limitiamo ad un cenno: fissato α, si approssimaα con una successione di numeri razionali {pn/qn}n∈N. La tentazione è didefinire

xα = limn→+∞

xpn/qn .

Il problema però è che non possiamo avanzare pretese sui numeri qn: po-trebbero essere alternativamente positivi o negativi. Allora, per essere certiche xpn/qn abbia senso, l’unica via d’uscita è chiedere che x > 0. Morale deldiscorso: possiamo elevare ad una potenza reale generica solo le basi positive.Un approccio alternativo, dovuto a Dedekind, propone di definire xα come ilvalore di

sup {rα | r ∈ Q, r ≤ x} = inf {rα | r ∈ Q, r ≥ x} .

Questa uguaglianza è però falsa per x < 0. Resta un ultimo, tremendo, dub-bio: siccome N ⊂ Z ⊂ Q ⊂ R, come ci comportiamo davanti all’espressionex2/3? Pensiamo 2/3 come un numero razionale oppure come un numero rea-le? Già, perché le primo caso possiamo scegliere x reale, mentre nel secondosolo x > 0! La risposta è quella più complicata6: quando l’esponente è unnumero razionale, lo trattiamo come tale, senza pensarlo come un numeroreale.

Per togliere qualsiasi ambiguità, converrebbe distinguere rigorosamente esenza eccezioni la funzione esponenziale dalla funzione inversa delle potenze.In altri termini, dovremmo considerare separatamente (per esempio) le duefunzioni

f : (0,+∞)→ R, f(x) = x2/3

g : R→ R, g(x) =3√x2.

Si può seguire senz’altro questa strada, ma i matematici amano ammorbidirele asperità della loro materia con qualche cedimento alle convenzioni.

Per concludere, c’è una situazione che molti studenti non sanno comeaffrontare: come si calcola 00? È una domanda insidiosa, che in effetti ha giàavuto implicitamente la risposta nella discussione precedente: l’operazione 00

5Questo è uno dei momenti, non troppo frequenti per fortuna, in cui si rimpiange dinon avere le basi di teoria dei sistemi numerici.

6I matematici scelgono spesso la strada più ricca di bivi, almeno quando questi biviarricchiscano la teoria.

Page 33: lezioni di matematica

2.1. OPERAZIONI SULLE FUNZIONI 25

non è definita. Per x 6= 0, possiamo pensare che x0 = xm−m = xm/xm, dovem è un numero intero (diverso da zero) qualunque. Allora, viene spontaneodire che x0 = 1 per x 6= 0. Ma questo ragionamento non è convincente perx = 0, poiché x−m è già privo di significato. A volte, i matematici convengonodi dare un senso ad un’espressione indefinita, e lo fanno con lo scopo disemplificare o unificare argomenti che richiederebbero una trattazione diversacaso per caso. Molti studiosi di analisi matematica usano la convenzione 00 =1, pensando che 00 = limx→0 x

0 = limx→0 1 = 1. Altri, invece, preferisconopensare che 00 = limx→0 0x = limx→0 0 = 0. Questo, da un punto di vistaavanzato, si interpreta con il fatto che la funzione di due variabili f(x, y) =xy, definita per x > 0 e y ∈ R, non è prolungabile per continuità in (0, 0). Chiscrive, se proprio è obbligato, ha una maggiore simpatia per la convenzione00 = 1, ma si tratta di gusti.

Definizione 2.4. Supponiamo che f : X → Y sia una funzione fra i dueinsiemi X e Y . Se Z è un sottoinsieme di X, la nuova funzione f |Z : Z → Ydefinita da f |Z(x) = f(x) per ogni x ∈ Z prende il nome di restrizione di fall’insieme Z.7

Restringere l’azione di una funzione a un dominio di definizione più pic-colo può apparire inutile. Il punto è che, per noi, una funzione è individuatain modo univoco dal suo dominio, dal suo codominio, e dalla sua legge. Adesempio, vedremo più avanti che la funzione f : R→ R definita dalla legge

f(x) =

−1, se x < 0

0, se x = 0

1, se x > 0

è discontinua nel punto x = 0, ma la sua restrizione a qualsiasi intervallo chenon contiene il punto x = 0 è continua. Questo ci convince che le restrizionidi una funzione possono godere di proprietà che la funzione di partenza nonpossiede.

2.1 Operazioni sulle funzioni

Quando lavoriamo con funzioni a valori reali, è facile estendere ad esse le quat-tro operazioni dell’aritmetica. Basta infatti operare sulle immagini, comenella definizione che segue.

7A volte si usa il simbolo f|Z .

Page 34: lezioni di matematica

26 CAPITOLO 2. FUNZIONI FRA INSIEMI

Definizione 2.5. Sia X un insieme, e siano f : X → R e g : X → R duefunzioni a valori reali. Definiamo la loro somma, il loro prodotto e il loroquoziente come

1. f + g : X → R, x 7→ f(x) + g(x)

2. fg : X → R, x 7→ f(x)g(x)

3. f/g : X \ {x ∈ X | g(x) = 0} → R, x 7→ f(x)/g(x),

Anche le funzioni possiedono delle operazioni, senza dubbio meno fa-miliari di quelle algebriche. A noi ne serviranno due: la composizione el’inversione.

Definizione 2.6. Siano f : X → Y e g : Y → Z due funzioni. La funzioneg ◦ f : X → Z definita da

g ◦ f : x ∈ X 7→ g(f(x)) ∈ Z

si chiama funzione composta di g ed f .

Osservazione 2.7. Qualche Autore, soprattutto quelli che si occupano dialgebra, usano la convenzione della composizione in ordine inverso rispettoal nostro. Per costoro, f ◦ g significa calcolare prima f e poi g.

Nella pratica, comporre due funzioni significa applicarle in successione,facendo attenzione all’ordine di scrittura. Graficamente,

x ∈ X 7→ f(x) ∈ Y 7→ g(f(x)) ∈ Z,

dove la prima freccia indica l’azione di f su x e la seconda freccia l’azionedi g su f(x). Questa rappresentazione evidenzia l’ipotesi che il codominio dif coincidesse con il dominio di g.8 In generale, non ha senso scrivere f ◦ g,perché il codominio di g non è il dominio di f . E anche se questa condizionestrutturale è soddisfatta, è facile costruire un esempio in cui f ◦g e g ◦f sonodue funzioni ben distinte.

Più macchinosa è la definizione di funzione inversa. Premettiamo unadefinizione fondamentale.

Definizione 2.8. Sia f : X → Y una funzione. Diciamo che f è iniettiva sead elementi x1 6= x2 di X sono associate sempre immagini f(x1) 6= f(x2) inY . Diciamo invece che f è suriettiva se f(X) = Y , cioè se per ogni y ∈ Yesiste un x ∈ X tale che f(x) = y. Diciamo infine che f è biunivoca se èiniettiva e suriettiva.

8In base a quanto detto poco sopra, basterebbe che f(X) fosse un sottoinsieme deldominio di g.

Page 35: lezioni di matematica

2.1. OPERAZIONI SULLE FUNZIONI 27

Supponiamo che f : X → Y sia una funzione biunivoca. Ad ogni y ∈ Y siassocia un elemento x ∈ X tale che f(x) = y. Ora, tale elemento x è unico:se ce ne fossero due, chiamiamoli x1 e x2, ovviamente x1 6= x2 e l’iniettivitàdi f implicherebbe

y = f(x1) 6= f(x2) = y,

cioè y 6= y. Questo è chiaramente impossibile, dunque esiste uno (per lasuriettività) ed uno solo (per l’iniettività) x ∈ X tale che f(x) = y. Maallora abbiamo costruito una funzione da y in X. Questa funzione, chechiameremo f−1, gode della proprietà che

f ◦ f−1 : y ∈ Y 7→ y ∈ Y (2.1)

ef−1 ◦ f : x ∈ X 7→ x ∈ X. (2.2)

Definizione 2.9. Sia f : X → Y una funzione biunivoca. La funzionef−1 : Y → X costruita sopra si chiama funzione inversa di f , ed è carat-terizzata dalle condizioni (2.1) e (2.2).

Diversamente da alcuni libri di testo, saremo piuttosto rigidi sul concettodi funzione invertibile. Come visto, per noi una funzione è invertibile quan-do è biunivoca. Altri chiedono sono l’iniettività: il dominio della funzioneinversa sarà l’immagine della funzione diretta. Questa è una convenzionelegittima e addirittura comoda in certi contesti elementari. Noi privilegiamola definizione più comune fra i matematici puri. Tuttavia, lo studente si con-vincerà facilmente di questo: qualsiasi funzione diventa suriettiva, a pattodi scegliere come codominio l’immagine della funzione. Se ci viene data unafunzione iniettiva f da un dominio X in un codominio Y , la nuova funzionef : X → f(X) è una funzione biunivoca e perciò invertibile. Sebbene f siauna funzione diversa da f , è comodo indulgere in questa confusione.

Riassumendo, le (2.1) e (2.2) dicono che la funzione inversa è effetti-vamente quell’operazione che “inverte” una funzione biunivoca rispetto allacomposizione ◦. Quando allo studente dovrà dimostrare che una certa funzio-ne è invertibile, dovrà verificare che la funzione è iniettiva e suriettiva. Puòfar comodo usare la caratterizzazione contenuta nella prossima proposizione.

Proposizione 2.10. Sia f : X → Y .

1. f è iniettiva se e solo se dall’uguaglianza f(x1) = f(x2) discende x1 =x2.

2. f è suriettiva se e solo se, per ogni y ∈ Y , l’equazione (nell’incognitax ∈ X) f(x) = y possiede almeno una soluzione.

Page 36: lezioni di matematica

28 CAPITOLO 2. FUNZIONI FRA INSIEMI

3. f è biunivoca se e solo se, per ogni y ∈ Y , l’equazione f(x) = y possiedeesattamente una soluzione x ∈ X. In tal caso, x = f−1(y).

Concretamente, tutto si riduce a risolvere equazioni. Purtroppo non tut-te le equazioni sono risolvibili in termini espliciti,9 e i metodi del calcolodifferenziale ci verranno in aiuto.

2.2 Funzioni monotòne e funzioni periodicheSpendiamo qualche parola sui rapporti fra le funzioni reali di variabile realee la relazione d’ordinamento fra numeri reali. Dati due numeri reali x1 ex2, esattamente una delle seguenti affermazioni deve essere vera: x1 < x2,oppure x1 = x2, oppure x1 > x2.

Definizione 2.11. Sia X ⊂ R un sottoinsieme, e sia f : X → R una fun-zione reale di una variabile reale. Diremo che f è monotona crescente (risp.crescente in senso stretto) se è soddisfatta la condizione seguente: se x1,x2 ∈ X e se x1 < x2, allora f(x1) ≤ f(x2) (risp. f(x1) < f(x2)). Di-remo che f è monotona decrescente (risp. decrescente in senso stretto) seè soddisfatta la condizione seguente: se x1, x2 ∈ X e se x1 < x2, alloraf(x1) ≥ f(x2) (risp. f(x1) > f(x2)).

A parole, le funzioni monotone crescenti rispettano l’ordinamento deinumeri reali, mentre quelle monotone decrescenti lo invertono.

Osservazione 2.12. Attenzione alla pronuncia dell’aggettivo “monotona”:l’accento cade sulla seconda lettera o. Il professore di matematica può esseremonòtono (accento sulla prima o), mentre le funzioni sono monotòne (accentosulla seconda o).

Teorema 2.13. Sia [a, b] un intervallo, e sia f : [a, b] → R una funzionestrettamente crescente (oppure strettamente decrescente). Allora f è inietti-va.

Dim. Siano x1 e x2 due elementi distinti di [a, b]. Non è restrittivo supporreche x1 < x2. Siccome f è strettamente crescente (oppure decrescente), avre-mo che f(x1) < f(x2) (oppure f(x1) > f(x2)), e in particolare f(x1) 6= f(x2).Pertanto f è una funzione iniettiva.

Corollario 2.14. Una funzione strettamente monotona è invertibile sullasua immagine, e la funzione inversa è strettamente monotona nello stessosenso della funzione diretta.

9Per esempio, sinx = x ha soluzione, ma non esiste una scrittura esplicita dellasoluzione.

Page 37: lezioni di matematica

2.3. GRAFICI CARTESIANI 29

Lasciamo allo studente piò volenteroso la dimostrazione di questo corol-lario. Una sola avvertenza: la funzione inversa rispetta il senso della mo-notonia. Per qualche suggestione psicologica, molti studenti sono convintiche l’inversa di una funzione crescente debba essere una funzione decrescen-te. Basta pensare all’esempio della funzione esponenziale e della funzionelogaritmo per non sbagliarsi.

Introduciamo infine un’ulteriore proprietà di alcune funzioni che incon-treremo spesso.

Definizione 2.15. Una funzione f : R→ R è periodica di periodo T > 0 se

f(x+ T ) = f(x), per ogni x ∈ R.

e T è il più piccolo numero positivo che soddisfi questa uguaglianza.

Ne consegue che, per conoscere una funzione T–periodica, basta conoscer-la su un qualunque intervallo di ampiezza T , ad esempio [0, T ] o [−T/2, T/2].

La clausola di minimalità di T è parte integrante della definizione diperiodicità. La funzione seno ha periodo T = 2π, ma sin(α + T ) = sinα èvera anche per tutti i multipli interi di 2π.

2.3 Grafici cartesianiIl piano cartesiano sarà, per noi, l’insieme dei punti di un piano nel quale sonostati scelte due rette perpendicolari. Queste rette si intersecano in un puntodetto origine, e sono chiamati assi cartesiani. I punti di questo piano sonocopppie ordinate di numeri reali, ed è suggestivo usare il simbolo R2 = R×Rper indicare brevemente il piano cartesiano.

Definizione 2.16. Sia f : X → Y una funzione, dove X, Y sono dueinsiemi. Il grafico di f è il sottoinsieme di X × Y

Γ(f) = {(x, f(x)) ∈ X × Y | x ∈ X}.

In pratica, il grafico di una funzione è costituito dalle coppie ordinate il cuiprimo elemento appartiene al dominio, e il secondo elemento è l’immagine delprimo elemento. Per le nostre funzioni reali di una variabile reale, il graficoè una sottoinsieme di R2. Di solito si tratta di una curva (nel senso intuitivodel termine), ma potrebbe anche essere un solo punto. Pensiamo infatti allafunzione x 7→

√−x2, definita evidentemente solo in {0}. Il suo grafico è

formato dal punto {(0, 0)} ∈ R2.Ci sembra opportuno insistere su un punto: non tutte le curve che si

possono disegnare nel piano cartesiano sono grafici di funzioni. Prendiamo

Page 38: lezioni di matematica

30 CAPITOLO 2. FUNZIONI FRA INSIEMI

per esempio una circonferenza o un’ellisse: sono rappresentanti delle ben noteconiche, ma non sono certamente grafici di funzioni reali di una variabile reale.Esistono infatti rette verticali che intersecano tali curve in due punti distinti,contro la definizione di funzione.

Ma come si “leggono”, su un grafico cartesiano, le proprietà di una funzio-ne? In genere, tutte le principali caratteristiche di una data funzione hannouna visibilità notevole nel grafico cartesiano. Per esempio, la suriettività cor-risponde al fatto che qualunque retta orizzontale interseca il grafico almenouna volta. Se ogni retta orizzontale interseca il grafico al massimo una vol-ta,10 la funzione è iniettiva. Se ogni r etta orizzontale interseca il grafico unaed una sola volta, allora la funzione è biunivoca.

La periodicità si rispecchia invece in una ripetizione esatta del graficoogni volta che l’ascissa si sposta di una quantità pari al periodo. Come dettosopra, basta pertanto tracciare il grafico su un intervallo di ampiezza pari alperiodo.

2.4 Funzioni elementari

In quest’ultima sezione introduttiva, riepiloghiamo le caratteristiche di alcunefunzioni di natura elementare. Queste costituiranno in un certo senso unarchivio a cui attingere esempi e controesempi nel corso del programma.

Innanzitutto, lo studente ricorderà le funzioni lineari affini, cio è le rettedel piano. Fatta eccezione per le rette verticali11, la generica funzione linereaffine ha la forma

x 7→ mx+ q,

per opportuni valori di m, q ∈ R. Le funzioni rappresentate invece dapolinomi di secondo grado sono invece parabole, e hanno la forma

x 7→ ax2 + bx+ c,

dove i coefficienti a, b e c sono numeri reali.Il lettore dovrebbe avere una certa familiarità anche con le funzioni espo-

nenziali, quelle rappresentate dalla formula

x 7→ ax,

10Cioè non lo interseca oppure lo interseca esattamente una volta.11Che non sono funzioni!

Page 39: lezioni di matematica

2.4. FUNZIONI ELEMENTARI 31

dove a ∈ (0,+∞).12 Il caso a = 1 non merita tante parole: la funzioneè chiaramente costante, poiché 1x = 1 qualunque sia l’esponente x. Nelcaso 0 < a < 1, la funzione esponenziale di base a è positiva, monotonadecrescente. Nel caso a > 1, essa è invece positiva ma monotona crescente.

Per quanto visto, la funzione esponenziale di base a ∈ (0, 1) ∪ (1,+∞) èinvertibile, e la sua funzione inversa si chiama logaritmo in base a. Si scrive

x ∈ (0,+∞) 7→ loga x.

Per a > 1, la funzione logaritmica è strettamente crescente, attraversa l’assedelle ascisse per x = 1, è negativa per 0 < x < 1 e positiva per x > 1.

Per 0 < a < 1, la funzione logaritmica è strettamente decrescente, positivaper 0 < x < 1 e negativa per x > 1. L’unico valore in cui si annulla è x = 1.

Concludiamo la panoramica con le funzioni goniometriche. Poiché unadefinizione rigorosa di tali funzioni può essere data solo avendo a disposizionestrumenti che introdurremo più avanti, ci affidiamo alle conoscenze pregressedello studente. Probabilmente, saprà che il seno di un angolo è il rapporto fracateto opposto e ipotenusa di un certo triangolo rettangolo, e così via. Periniziare, questa “definizione” geometrica ci basta. Abbiamo dunque a nostradisposizione due funzioni,

x ∈ R 7→ sinx

x ∈ R 7→ cosx,

chiamate rispettivamente seno e coseno, definite sull’intero insieme dei nume-ri reali, periodiche di periodo 2π. A queste si affianca la funzione tangente,definita come

tanx =sinx

cosx

per ogni x ∈ R \ {kπ/2 | k ∈ Z}. 13 La tangente è una funzione periodicadi periodo π, e sull’intervallo (−π/2, π/2) è strettamente crescente, nulla inx = 0.

Osservazione 2.17. Gli angoli saranno sempre misurati in radianti. L’usodei gradi sessagesimali, cui lo studente è forse più abituato, si adatta maleal calcolo differenziale. Ricordiamo che la relazione fra la misura αgradi ingradi sessagesimali e quella αrad in radianti di un angolo α è stabilita dallaseguente proporzione:

αrad : αgradi = 2π : 360.

12La base a è un numero positivo per ipotesi. Infatti, è problematico elevare un numeronegativo ad un esponente reale, e questo ci costringerebbe a distinguere vari casi.

13Questa scrittura apparentemente complicata è la scrittura simbolica per la frase “xdiverso da tutti i multipli interi di π/2”.

Page 40: lezioni di matematica

32 CAPITOLO 2. FUNZIONI FRA INSIEMI

Quindiαrad =

π

180αgradi.

Page 41: lezioni di matematica

Capitolo 3

Successioni di numeri reali

In questo capitolo, introdurremo uno degli strumenti più importanti di tuttal’Analisi Matematica, le successioni. Ci imbatteremo per la prima volta nelladefinizione di limite, e dimostreremo un certo numero di teoremi fondamentaliche avranno dei corrispettivi nella teoria dei limiti per le funzioni.

3.1 Successioni e loro limitiDefinizione 3.1. Una successione di numeri reali è una qualunque funzionep : N→ R. Per consuetudine, useremo la scrittura pn invece della più rigidanotazione funzionale p(n) per denotare il valore della funzione p in n ∈ N.Parleremo poi, sempre con un certo abuso di notazione, della successione{pn}.

Una successione viene spesso presentata come un allineamento (infinito)di numeri reali

p1, p2, p3, . . . , pn, pn+1, . . .

Per questo motivo, si trova frequentemente la notazione

{p1, p2, p3, . . . , pn, pn+1, . . . } (3.1)

per indicare la successione {pn}. C’è sfortunatamente un aspetto che richiedemolta attenzione da parte dello studente. La notazione (3.1) si confonde deltutto con l’insieme {p1, p2, p3, . . . , pn, pn+1, . . . } ⊂ R. Tutto ciò è spiacevole,dato che una funzione è un oggetto ben diverso dalla sua immagine. A costodi essere ripetitivi, consideriamo la successione così definita:

pn =

{1, se n è pari−1, se n è dispari.

33

Page 42: lezioni di matematica

34 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

L’immagine di {pn} è formata dall’insieme {−1, 1}, mentre la successione ècostituita da infiniti numeri reali. In questo senso l’uso delle parentesi graffeper denotare tanto la successione quanto l’insieme dei punti sulla retta realeda essa individuati è azzardata. La tradizione didattica, così consolidata,rende inutile ogni battaglia contro questo abuso di notazione.

Osservazione 3.2. Osserviamo che qualunque successione è in realtà la re-strizione a N di infinite funzioni di una variabile reale. Data infatti unaqualunque successione {pn}, possiamo definire infinite funzioni f : R→ R inmaniera tale che f(n) = pn per ogni n ∈ N. Ad esempio, possiamo specificareassolutamente a caso i valori di f(x) per x ∈ R \ N.

L’Osservazione sopra ci permette di fare una divagazione divertente conun finale polemico. Tutti ci siamo imbattuti, prima o poi, nel seguente “rom-picapo”: data una sequenza di quattro o cinque numeri (solitamente naturali),dire quale sarà il numero successivo. È chiaro che, per un matematico, que-sto è un rompicapo assolutamente ozioso: basta scrivere un numero a caso!Chiaramente non sarà mai la soluzione prevista da chi pone il dilemma. Adesempio, se la sequenza è “1,3,5,7,9”, sembra plausibile congetturare che il nu-mero successivo sarà 11, data l’assonanza evidente con i primi numeri dispari.In tutti questi casi, il vero rompicapo è capire che cosa significhi scrivere unnumero che segue logicamente quelli dati. Un buon rompicapo dovrebbe pos-sedere una soluzione inequivocabile, e soprattutto utilizzare questi problemiper selezionare le future matricole universitarie appare un’idea abbastanzadiscutibile.

Definizione 3.3. Una successione {pn} è crescente (risp. strettamente cre-scente) se pn ≤ pn+1 (risp. pn < pn+1) per ogni n, e decrescente (risp.strettamente decrescente) se vale la disuguaglianza opposta (risp. la disugua-glianza stretta opposta). La successione {pn} è limitata se esiste una costanteM > 0 tale che |pn| ≤M per ogni n.

Definizione 3.4. Diremo che la successione {pn} tende al valore ` ∈ R pern→ +∞, e scriveremo limn→+∞ pn = ` oppure pn → ` per n→ +∞, se, perogni ε > 0 esiste N ∈ N tale che

|pn − `| < ε per ogni n > N.

Definizione 3.5. Diremo che una successione {pn} di numeri reali è con-vergente se essa possiede un limite nel senso della definizione precedente. Incaso contrario, diremo che la successione è divergente.

Un primo avvertimento che ci sembra doveroso dare è che i libri di testoitaliani usano una terminologia molto più descrittiva. Noi abbiamo usato

Page 43: lezioni di matematica

3.1. SUCCESSIONI E LORO LIMITI 35

l’aggettivo “divergente” per la negazione logica di “convergente”. La tradizio-ne italiana usa tale aggettivo per indicare che la successione tende all’infi-nito, come vedremo fra poco. La negazione della convergenza si divide cosìin due sotto-classi: tendere all’infinito e assumere infinite volte valori pros-simi a piacere a due numeri distinti. Chi scrive, senz’altro sotto l’influssodel bellissimo libro di Walter Rudin [24], preferisce evitare questa ulterioredistinzione. Nell’economia di questo corso, per inciso, sarebbe anche pocosaggio dare eccessiva importanza alle successioni che “oscillano” fra due valoridiversi.

Osservazione 3.6. È fondamentale che lo studente si renda conto del se-guente fatto: se esiste un numero N ∈ N che soddisfa le richieste contenutenella definizione di limite, anche tutti i numeri naturali N > N andrannobene.

Un’osservazione particolarmente importante è che i “primi” termini di unasuccessione sono ininfluenti al fine dell’esistenza del limite.

Proposizione 3.7. Siano {pn} e {qn} due successioni, e supponiamo cheesista un numero naturale n0 tale che pn = qn per ogni n > n0. Sotto questeipotesi, la successione {pn} possiede limite (finito oppure infinito) se e solose la successione {qn} possiede limite, ed in tal caso i due limiti coincidono.

Dim. Supponiamo che limnto+∞ pn = ` ∈ R. Per definizione, fissato ε > 0esiste N ∈ N tale che |pn − `| < ε per ogni n > N . Posto N1 = max{N, n0},ovviamente |qn − `| < ε per ogni n > N1, dal momento che qn = pn per talivalori dell’indice n. Quindi limn→+∞ qn = `. Poiché questo ragionamento èperfettamente simmetrico, possiamo scambiare il ruolo di {pn} e di {qn}, econcludere che se limn→+∞ qn = ` allora anche limn→+∞ pn = `. Il caso dellimite infinito è lasciato per esercizio.

Lo studente non deve comunque sopravvalutare la portata della Proposi-zione appena dimostrata: se il limite rappresenta il comportamento della suc-cessione per indici molto grandi, è naturale che si disinteressi dell’andamentodella successione per valori “piccoli” dell’indice.

Ma come si controlla, operativamente, che una successione sia convergen-te? Vediamolo con un esempio. Consideriamo la successione {n−1

n+1}, e verifi-

chiamo che è convergente al limite ` = 1. In base alla definizione, dobbiamofissare a nostro piacere un numero ε > 0, e verificare che la disequazione∣∣∣∣n− 1

n+ 1− 1

∣∣∣∣ < ε

Page 44: lezioni di matematica

36 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

è soddisfatta per tutti i valori di n maggiori di qualche N . Riscriviamo ladisequazione facendo il denominatore comune:∣∣∣∣n− 1− n− 1

n+ 1

∣∣∣∣ < ε,

cioè2

n+ 1< ε.

La domanda è: esiste un indice N ∈ N tale che 2n+1

< ε sia soddisfatta perogni n > N? Per rispondere, “risolviamo” la disequazione 2

n+1< ε rispetto a

n:n >

2

ε− 1.

Pertanto, se scegliamo N uguale al primo numero naturale maggiore di 2ε−1,

abbiamo finito la verifica del limite proposto.Dunque la verifica di un limite si riduce nel “risolvere” una disequazione

e nel dimostrare che l’insieme delle soluzioni contiene tutti i numeri naturalimaggiori di un opportuno valore. Prima di passare oltre, osserviamo che ilvalore del limite ` è stato “regalato”, e che non saremmo riusciti a calcolar-lo con la sola definizione. Vedremo fra poco quali strumenti esistano perl’effettivo calcolo dei limiti.

La prossima domanda è se possano esistere due numeri `1 e `2 che sianoentrambi il limite di {pn}? La risposta è negativa.1

Proposizione 3.8. Se pn → `1 e pn → `2, allora `1 = `2.

Dim. Supponiamo che `1 < `2 e mostriamo che questo porta ad una contrad-dizione. Un ragionamento del tutto simile vale anche sotto l’ipotesi (assurda)`1 > `2, e perciò non resta che `1 = `2. Dunque, sia ε = 1

2(`2 − `1) > 0.

Applichiamo la definizione di limite per `1: esiste N1 ∈ N tale che

|pn − `1| < ε se n > N1.

Applicando la definizione a `2, troviamo che esiste N2 ∈ N tale che

|pn − `2| < ε se n > N2.

Scegliamo N > max{N1, N2}. Quindi

`2 − `1 ≤ |pn − `1|+ |pn − `2| < `2 − `1,

assurdo.1Almeno per successioni di numeri reali. In contesti molto più generali, una successione

potrebbe addirittura ad infiniti limiti diversi.

Page 45: lezioni di matematica

3.1. SUCCESSIONI E LORO LIMITI 37

Nella dimostrazione abbiamo usato la disuguaglianza triangolare

|x− y| ≤ |x− z|+ |z − y| (3.2)

valida per ogni terna x, y, z di numeri reali. Un’altra proprietà delle suc-cessioni convergenti, cioè delle successioni che tendono a un limite nel sensodella nostra definizione, è che sono successioni limitate.

Proposizione 3.9. Ogni successione convergente è limitata.

Dim. Infatti, se limn→+∞ pn = `, allora esiste N ∈ N, corrispondente allascelta di ε = 1, tale che |pn− `| < 1 se n > N . Quindi, per la disuguaglianzatriangolare,

|pn| < M = max{|p1|, |p2|, . . . , |pN |, 1 + |`|}.

Osservazione 3.10. È però falso che ogni successione limitata converge. Lasuccessione {1,−1, 1,−1, 1,−1, . . . } è limitata (M = 1 nella definizione), manon converge. Vedremo comunque che tutte le successioni limitate hannouna sottosuccessione convergente.

Prima di proseguire, osserviamo che alle successioni possono essere ap-plicate le quattro operazioni algebriche. Precisamente, se {pn}, {qn} sonosuccessioni e se α ∈ R, possiamo definire le successioni

pn + qn, αpn, pnqn,pnqn

sotto l’ovvia condizione che qn 6= 0 quando qn appare a denominatore.Il seguente teorema afferma che l’operazione di limite rispetta le opera-

zioni algebriche.

Teorema 3.11. Siano {pn} e {qn} due successioni. Se pn → ` e qn → mper n→ +∞, allora

1. pn + qn → `+m;

2. αpn → α`;

3. pnqn → `m;

4. pnqn→ `

mse m 6= 0.

Page 46: lezioni di matematica

38 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Dim. Le affermazioni 1 e 2 sono ovvie. Vediamo la 3, un po’ più difficile. Peripotesi, dato ε > 0 esistono N1 ed N2 in N tali che |pn− `|| < ε e |qn−m| < εrispettivamente per n > N1 ed n > N2. Fissiamo N > max{N1, N2} eosserviamo che per n > N

|pnqn − `m| = |pnqn − `qn + `qn − `m| ≤ |pn − `||qn|+ |`||qn −m| (3.3)

per la disuguaglianza triangolare. Poiché ogni successione convergente èlimitata, avremo |qn| < M , e dunque

|pnqn − `m| ≤Mε+ |`|ε = (M + |`|)ε.

Poiché ε > 0 è arbitrario, altrettanto arbitrario è il numero (M + |`|)ε, equindi anche 3 è dimostrata. La dimostrazione di 4 è del tutto analoga, e lostudente può provare a dimostrarla da solo, oppure può studiarla su uno deillibri di testo consigliati.

Nell’ultima dimostrazione, ci sono due passaggi la cui importanza non vasottovalutata. Lo studente deve capirli bene e saperli adattare a situazionisimili.

Il primo passaggio è di natura logica. Se un numero ε è piccolo a piacere,altrettanto lo è 2ε, o anche 100ε. L’importante è che il fattore moltiplicativodi ε sia indipendente da ε stesso.2

Il secondo passaggio, è la tecnica di sommare e sottrarre una medesima– o anche più – quantità per raggruppare termini che fanno comodo. Nell’e-quazione (3.3), sommare e sottrarre `qn ci ha permesso di raccogliere a fattorcomune termini come |pn − `|, che sapevamo stimare con ε. Avremo l’occa-sione di applicare questa tecnica molto spesso, e l’unica regola per scoprireche cosa aggiungere e togliere è l’esperienza. All’inizio, si procede by trialand error, cioè provando senza paura di sbagliare.

Molti studenti ricorderanno che quando si studiano i limiti, i guai vengonodalle forme di indecisione. Per poterne parlare, occorre per ò estendere ladefinizione di limite.

Definizione 3.12. Sia {pn} una successione. Diciamo che {pn} tende a +∞(risp. a −∞), e scriviamo limn→+∞ pn = +∞ (risp. limn→+∞ pn = −∞) seper ogni numero reale M > 0 esiste un indice N ∈ N tale che pn > M perogni n > N (risp. pn < −M per ogni n > N).

Osservazione 3.13. Fra i matematici è in voga la locuzione “la successione{pn} esplode”. Di solito, con questo linguaggio un po’ colorito intendono direche limn→+∞ pn = +∞.

2Ovvio, perché ε−1ε = 1 non è affatto piccolo a piacere.

Page 47: lezioni di matematica

3.1. SUCCESSIONI E LORO LIMITI 39

Per esercizio, verifichiamo mediante questa definizione che limn→+∞ log n =+∞. Fissiamo arbitrariamente un numero reale M > 0, e cerchiamo di sce-gliere N ∈ N tale che log n > M per ogni n > N . Poiché la disuguaglianzalog n > M equivale a n > eM , ci basta scegliere il primo numero naturale Nmaggiore di eM .

È ovvio che non tutte le relazioni di limite possono essere verificate ap-pliacndo pedissequamente la definizione. È conveniente dicorrere alle regoleper il calcolo algebrico dei limiti, ogni volta che ciò sia possibile in virtù deiteoremi visti nella pagine precedenti.

Sfortunatamente, esistono situazioni in cui le regole algebriche non pos-sono essere conclusive: stiamo parlando delle forme di indeterminazione.Dando per scontato che n→ +∞ e 1/n→ 0 quando n→ +∞, vediamo che

n · 1

n= 1→ 1

e dovremmo ipotizzare che +∞ · 0 = 1. Se però cambiamo l’esempio,

n2 · 1

n= n→ +∞

e dunque +∞ · 0 = +∞. C’è di che diventare matti. Ma insomma, quantofa “zero per infinito”? La risposta è che... non fa! È la prima forma diindecisione che incontriamo, e nasconde un fatto piuttosto sottile: non tuttigli infiniti sono uguali fra loro.3 Si usa scrivere [0 · ∞] fra parentesi, persottolineare che la moltiplicazione scritta richiede ulteriori precisazioni.

Altre forme di indecisione molto popolari fra gli studenti sono[0

0

],[∞∞

], [+∞−∞].

Altrettanto indeterminate sono le espressioni[00], [1∞] ,

sebbene pochi studenti sembrino ricordarsene. A parte l’ultima e “patologi-ca” espressione,4 tutte le altre sono caratterizzate dalla presenza di 0 e ∞.La forma di indecisione più complicata è probabilmente [+∞−∞], mentreper quelle di natura moltiplicativa esistono tecniche raffinate e potenti cheincontreremo a tempo debito. L’aspetto sgradevole è che queste tecniche ri-chiedono il calcolo differenziale, e non sono pertanto direttamente applicabilialle successioni.

3A conferma del fatto che ∞ non designa un numero.4Ci sono nascosti dei logaritmi, come vedremo più avanti.

Page 48: lezioni di matematica

40 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Osservazione 3.14. Perché introdurre la teoria dei limiti per le successioni,considerato che impareremo presto la teoria dei limiti per tutte le funzioni diuna variabile reale? La risposta è che le successioni sono uno strumento moltoutile e forniscono tecniche dimostrative particolarmente intuitive di alcuniteoremi. Inoltre, tutto il mondo informatico che ci circonda è basato sullesuccessioni: i numeri vengono rappresentati come approssimazioni decimali(o meglio binarie), ed anche i più avanzati software di calcolo utilizzanotecniche basate sulle successioni per fornire risposte.

3.2 Proprietà asintotiche delle successioniIn questa lezione, vedremo una serie di risultati riguardanti le propriet àdelle successioni, che valgono “da un certo indice in poi”. Innanzitutto,formalizziamo questa frase.

Definizione 3.15. Data una successione {pn}, diremo che una proprietàvale definitivamente per {pn} quando esiste un indice N ∈ N tale che laproprietà vale per ogni pn con indice n > N .

Osservazione 3.16. L’aggettivo “definitivamente” dipende in modo essen-ziale dalla successione. Per essere più chiari, “definitivamente” per una suc-cessione {pn} non significa “definitivamente” anche per un’altra successione{qn}. Infatti, l’indice N che funziona per la prima successione potrebbe nonessere abbastanza grande da funzionare anche per la seconda successione.Tuttavia, non siamo di fronte ad un grande problema. Se per la prima suc-cessione troviamo un indice N1 e per la seconda un altro indice N2, è chiaroche l’indice N = max{N1, N2} va bene per entrambe, in quanto N è piùgrande sia di N1 che di N2.5

Ad esempio, una successione è definitivamente positiva se tutti i termi-ni sono positivi tranne (al più) un numero finito. Inoltre, una successio-ne converge a ` se e solo se la disuguaglianza ` − ε < pn < ` + ε è veradefinitivamente.

Il primo teorema che dimostriamo è molto importante.

Teorema 3.17 (Permanenza del segno). Supponiamo che limn→+∞ pn = ` ∈R.

1. Se ` > 0 (risp. ` < 0), allora pn > 0 (risp. pn < 0) definitivamente.5La scrittura N = max{N1, N2} significa precisamente che N è il più grande fra N1 e

N2. Ancora più esplicitamente, si confrontano fra loro N1 e N2, e si sceglie il maggiore deidue: quello sarà N .

Page 49: lezioni di matematica

3.2. PROPRIETÀ ASINTOTICHE DELLE SUCCESSIONI 41

2. Se pn ≥ 0 (risp. pn ≤ 0) definitivamente, allora ` ≥ 0 (risp. ` ≤ 0).

Dim. Infatti, supponiamo ` > 0. Fissiamo ε = 12`, e scegliamo N ∈ N tale

che `− ε < pn < `+ ε per ogni n > N . Quindi, in particolare, pn > `− ε =12ε > 0 per n > N . Questo dimostra il punto 1.Il punto 2 segue dal punto 1. Infatti, se ` < 0, allora sarebbe anche pn < 0

definitivamente, contro l’ipotesi pn ≥ 0.

Nel punto 2 del teorema precedente, la disuguaglianza stretta nell’ipotesinon garantisce la disugualianza stretta nella tesi. Infatti, consideriamo lasuccessione pn = 1/n. Chiaramente, pn > 0 per ogni n, ma pn → 0 pern→ +∞.

C’è sempre un punto sul quale gli studenti dimostrano molta difficoltà:rendersi conto che certe successioni non hanno limite, né finito né infinito.Volendo fare un esempio, possiamo considerare la successione

{1,−1, 1,−1, 1,−1, 1,−1, . . . }.

Questa successione alterna i due valori 1 e −1 periodicamente, e dovrebbeessere chiaro che non può esistere alcun numero reale ` che sia limite dellasuccessione. Si tratta di un principio generale che, per i limiti di questo corso,non possiamo inquadrare in un teorema.6 Per sgombrare il campo da futurediscussioni, precisiamo che per noi esistono solo due categorie di successioni:quelle convergenti e quelle divergenti. La successione appena vista è pertantodivergente. Molti testi elementari parlano invece di successioni oscillanti.Non c’è nulla di male in questo, ma non ci sem bra utile costringere lostudente a imparare a memoria classificazioni ben poco utili. In fondo, ilimiti sono utili quando esistono, finiti o anche infiniti. Quando non esistono,l’importante è capire perché non esistono.

Vi è una categoria di successioni il cui comportamento è piuttosto rego-lare. Si tratta delle successioni monotone.

Proposizione 3.18. Sia {pn} una successione monotona crescente (o de-crescente). Se {pn} è limitata, allora {pn} converge, e il limite coincide consupn∈N pn (oppure con infn∈N pn se {pn} è decrescente.)

6Lo studente più curioso si accontenterà di sapere che, a fianco del limite, esistonoanche il limite inferiore lim infn→+∞ e il limite superiore lim supn→+∞. Una successioneconverge se e solo se i limiti inferiore e superiore sono uguali. Purtroppo, la definizione deilimiti inferiore e superiore non è semplice, e preferiamo evitare di aggiungere complicazioniulteriori.

Page 50: lezioni di matematica

42 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Dim. Infatti, supponiamo che {pn} sia crescente, e poniamo S = supn∈N pn.L’ipotesti di limitatezza della successione implica che S ∈ R.7 Sia ε > 0fissato arbitrariamente. Per definizione di estremo superiore, esiste N ∈ Ntale che S − ε < pN < S. Per la monotonia di {pn}, se n > N allora

S − ε < pN ≤ pn < S,

e questo significa che pn → S per n→ +∞. La dimostrazione nel caso in cui{pn} sia decrescente è analoga.

Forse lo studente avrà notato che la Proposizione precedente ammetteuna immediata generalizzazione.

Proposizione 3.19. Una successione crescente e illimitata dall’alto divergea +∞. Una successione decrescente e illimitata dal basso diverge a −∞.

Dim. In effetti, la Proposizione precedente dimostra che una successione mo-notona tende8 sempre all’estremo superiore oppure all’estremo inferiore. Seuna successione è illimitata, almeno uno di tali estremi è infinito.

Osservazione 3.20. In realtà, la gran parte dei teoremi che parlano di suc-cessioni e dei loro limiti hanno un’immediata generalizzazione secondo laterminologie del “definitivamente”. Solo per fare un esempio, una successionedefinitivamente monotona, cioè una successione che comincia ad essere mo-notona dopo un certo indice,9 ovviamente possiede un limite, finito o infinito.Questo dovrebbe essere abbastanza chiaro, dal momento che i primi terminidi una successione non ne influenzano il comportamento asintotico.

Enunciamo e dimostriamo uno dei criteri più usati per dimostrare la con-vergenza delle successioni. Come accade sovente in matematica, il principioè quello di ricondursi al caso precedente.

Teorema 3.21 (Due carabinieri). Siano {an}, {bn} e {pn} tre successioni.Supponiamo che limn→+∞ an = limn→+∞ bn = ` ∈ R, e che an ≤ pn ≤ bndefinitivamente. Allora limn→+∞ pn = `. Se invece an → +∞ allora pn →+∞, e se bn → −∞ allora pn → −∞.

Dim. Infatti, fissiamo ε > 0 e scegliamo N ∈ N tale che `− ε < an < `+ ε e`− ε < bn < `+ ε. Quindi

`− ε < an ≤ pn ≤ bn < `+ ε,

7A volte, scriveremo S < +∞.8Usiamo questo verbo con una certa imprecisione.9Resta inteso che la monotonia deve sussistere per sempre, oltre quel valore dell’indice.

Page 51: lezioni di matematica

3.3. INFINITESIMI ED INFINITI EQUIVALENTI 43

e la prima parte del teorema è dimostrata. Se am → +∞, allora pn è definiti-vamente maggiore di qualunque numero fissato, dato che pn ≥ an. Lasciamoallo studente il caso bn → −∞, che si tratta in maniera del tutto analoga.

Una parola di commento sulla terminologia. L’appellativo “dei due ca-rabinieri” rappresenta la classica immagine di due carabinieri ({an} e {bn})che scortano in prigione (il limite) il prigioniero ({pn}), affiancandolo passodopo passo. È un’immagine che appare in molti libri per ragazzi di centoanni fa. Apparentemente, i corpi di polizia dei paesi anglosassoni non han-no mai avuto l’abitudine di scortare i malfattori in questo modo, ed infattinessun testo di calculus dimostra alcun “two–policemen theorem”. Un’altraspiegazione è che associare galeotti e teoremi di matematica non è un buonmodo di rendere l’analisi matematica più affascinante.

Spesso il Teorema dei due carabinieri si applica alle successioni positive,scegliendo an = 0 per ogni n. Pensiamo all’esempio{

sinn

n

}.

Non è affatto immediato verificare che questa successione ha limite, dato che{sinn} ha un comportamento piuttosto bizzarro. Tuttavia, basta osservareche | sinn| ≤ 1, e quindi

0 ≤∣∣∣∣sinnn

∣∣∣∣ ≤ 1

n,

per concludere che la successione tende a zero. Il teorema dei due carabinierisi applica con an = 0 e bn = 1/n.

In realtà non è veramente restrittivo pensare alle successioni che conver-gono a zero. Vale il seguente risultato, la cui dimostrazione immediata èlasciata per esercizio.

Proposizione 3.22. Una successione {pn} converge a ` ∈ R se e solo se lasuccessione di numeri non negativi {|pn − `|} converge a zero.

3.3 Infinitesimi ed infiniti equivalenti

In questa sezione, vogliamo introdurre un linguaggio piuttosto diffuso e co-modo per confrontare due successioni con lo stesso comportamento.

Definizione 3.23. Sia {pn} e {qn} due successioni, entrambe tendenti a zero(rispettivamente ad infinito). Diciamo che {pn} è un infinitesimo (rispetti-

Page 52: lezioni di matematica

44 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

vamente un infinito) equivalente a {qn}, in simboli10

pn � qn,

selim

n→+∞

pnqn

= 1.

Osservazione 3.24. Ovviamente, se due successioni {pn} e {qn} sono taliche limn→+∞ pn/qn = ` 6= 0, allora pn � `qn.

La principale utilità degli infinitesimo (ed infiniti) equivalenti è contenutanella seguente

Proposizione 3.25. Supponiamo che {an}, {pn} e {qn} siano successioni,e che pn � qn. Allora

limn→+∞

anpn = limn→+∞

anqn.

Dim. Infatti,

limn→+∞

anpn = limn→+∞

anpnqnqn = lim

n→+∞anqn,

nel senso che il limite limn→+∞ anpn esiste se e solo se esiste limn→+∞ anqn,e i due valori coincidono.

In breve, è possibile sostituire fra di loro gli infinitesimi (o gli infiniti)equivalenti nelle strutture moltiplicative. Lo studente faccia attenzione anon tentare questa strada nel caso additivo: è falso che

limn→+∞

an + pn = limn→+∞

an + qn

se pn � qn.

3.4 SottosuccessioniImmaginiamo di avere una successione

{p1, p2, p3, . . . , pn, . . . }

e di selezionare alcuni elementi da essa, avendo cura di prenderli in ordinecrescente di indici. Per esempio, potremmo selezionare

p3, p10, p11, p50, p100, . . .

Anche se a prima vista sembra un po’ curioso, abbiamo costruito un’altrasuccessione. Diamo una definizione generale per questo procedimento.

10Su alcuni testi si trova pn ∼ qn, oppure pn ≈ qn.

Page 53: lezioni di matematica

3.5. IL NUMERO E DI NEPERO 45

Definizione 3.26. Una successione {qn} è una sottosuccessione di {pn} seqn = pk(n), dove k : N → N è una funzione strettamente crescente. Perbrevità, si scrive spesso {pkn}.

Teorema 3.27. Una successione converge a un limite ` se e solo se tutte lesue sottosuccessioni convergono a `.

Omettiamo la dimostrazione di questo teorema, ma vogliamo evidenziarnel’importanza. Per esempio, la successione {1/n2} converge a zero perchéè una sottosuccessione di {1/n}. Per lo stesso motivo, per ogni numeronaturale κ > 0 la successione {1/nκ} converge a zero. Lo studente non devepensare che questo ragionamento giustifichi la scrittura limn→+∞ 1/nα = 0per ogni numero reale α > 0. Infatti, quando α non è un numero naturale,{nα} non è una sottosuccessione di {n}. Per esempio, quando α = 1/2, lasuccessione

1,√

2,√

3,√

4, . . . ,

non è una sottosuccessione di 1, 2, 3, 4, . . . ,Concludiamo con un teorema di esistenza. È un caso molto speciale di uno

dei teoremi più usati in tutta l’analisi matematica, il teorema di compattezzaper successioni degli insiemi chiusi e limitati di Rn.

Teorema 3.28. Sia [a, b] un intervallo chiuso e limitato di R. Ogni suc-cessione {pn} tale che pn ∈ [a, b] per ogni n, possiede una sottosuccessioneconvergente a qualche elemento di [a, b].

Ad esempio, la successione {1,−1, 1,−1, 1,−1, . . . } cade nelle ipotesi diquesto teorema.11 Infatti una sottosuccessione convergente esiste senz’altro:{1, 1, 1, 1, . . . }. Molto meno scontato è il fatto che la successione {sinn}possegga una sottosuccessione convergente.

Corollario 3.29. Ogni successione limitata di numeri reali possiede unasottosuccessione convergente.

Dim. Se {pn} è limitata, esiste M > 0 tale che |pn| < M per ogni n. Allorapn ∈ [−M − 1,M + 1] per ogni n, e dunque si applica il teorema precedente.

3.5 Il numero e di NeperoLo studente avrà senza dubbio già sentito parlare del numero di Nepero,12

indicato dalla lettera e. È uno dei numeri più celebri della matematica ele-11Si può scegliere [a, b] = [−1, 1].12O meglio di John Napier.

Page 54: lezioni di matematica

46 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

mentare, insieme a π e all’unità immaginaria i =√−1.13 Il numero e è

anche la base di logaritmi universalmente utulizzata nelle scienze, avendoormai soppiantato in quasi tutti i settori la più classica base 10.14 Occorreuna definizione che individui tale numero senza possibilità di errore. Esistonodue definizioni (evidentemente equivalenti) di e. La prima, e anche la piùcomoda per fare i calcoli, è

e =∞∑n=0

1

n!.

Il simbolo n! = 1 · 2 · 3 · · · · · (n− 1) · n è il fattoriale di n, ma il guaio è chenoi non sappiamo sommare infiniti numeri reali, come richiesto dalla formulaprecedente. Dovremmo addentrarci nella teoria delle serie numeriche, mausciremmo dai limiti di questo corso.

Proponiamo invece la seguente definizione, ormai comprensibile allo stu-dente:

e = limn→+∞

(1 +

1

n

)n. (3.4)

Insomma, e è il limite della successione di termine n-esimo

en =

(1 +

1

n

)n.

Ma chi garantisce che {en} abbia un limite, e che questo limite sia finito?Poiché [1∞] è una forma di indecisione,15 certo non i teoremi sul calcoloalgebrico dei limiti. Si potrebbe dimostrare con un po’ di fatica, ma noinon lo faremo, che {en} è una successione monotona crescente e limitata. Diconseguenza, {en} ha un limite finito, e battezziamo e tale limite. Usandoun programma di calcolo, si trova la seguente approssimazione con cinquantacifre decimali esatte:

e ≈ 2.7182818284590452353602874713526624977572470937000 . . .

13La formula eiπ+1 = 0 è considerata una delle relazioni più belle di tutta la matematica,poiché coinvolge in maniera semplice i cinque numeri più importanti: 0, 1, e, π ed i.

14Questa affermazione è vera quando si vuole usare il calcolo differenziale. Un tempoi logaritmi servivano per fare velocemente i calcoli, ed era inevitabile scegliere come base10, poiché siamo abituati ad usare il sistema decimale per esprimere i numeri. Se fossimoabituati ad operare nel sistema binario dei computer, useremmo con maggior profitto labase 2.

15Lo studente mediti sul fatto che limn→+∞ 1pn = 1, qualunque sia la successione{pn} che diverge a ∞. Non è in contraddizione con l’affermazione che [1∞] è una formaindeterminata?

Page 55: lezioni di matematica

3.6. APPENDICE: SUCCESSIONI DI CAUCHY 47

Si dimostra che e è un numero irrazionale e che

limn→+∞

(1 +

1

n

)n=

+∞∑n=0

1

n!.

3.6 Appendice: successioni di CauchySupponiamo che {pn}n sia una successione convergente ad un limite (finito)`. Per ogni ε > 0, esiste n ∈ N tale che per ogni n > N si ha |pn − `| < ε/2.Sia m > N ; dalla disuguaglianza triangolare deduciamo che

|pn − pm| ≤ |pn − `|+ |pm − `| <ε

2+ε

2= ε.

A parole, abbiamo dimostrato che la distanza fra due termini di indice suffi-cientemente grande di una successione convergente può essere resa piccola apiacere. Diamo un nome alle successioni che soddisfano questa proprietà.

Definizione 3.30. Una successione {pn}n si chiama successione di Cauchyse, per ogni ε > 0 esiste N ∈ N tale che

|pn − pm| < ε per ogni n,m > N . (3.5)

Dalla discussione precedente, tutte le successioni convergenti sono succes-sioni di Cauchy. Ora, di fronte a questo genere di implicazione, viene spon-taneo domandarsi se le successioni di Cauchy coincidano con le successioniconvergenti. La risposta è contenuta nel seguente teorema.

Teorema 3.31 (Completezza di R). Ogni successione di Cauchy di numerireali è convergente.

Premettiamo un risultato che interverrà nella dimostrazione.

Proposizione 3.32. Sia {pn}n una successione di Cauchy. Se una sotto-successione {pnk}k converge a un limite `, allora tutta la successione {pn}nconverge a `.

Dim. Sia ε > 0. Esiste N ∈ N tale che, per ogni n,m > N risulta |pn−pm| <ε. Per ipotesi, in corrispondenza di ε, esiste un indice K ∈ N tale che|pnK − `| < ε. Fissiamo un numero naturale N > max{N, nK}. Per ogniindice n > N , risulta

|pn − `| ≤ |pn − pnK |+ |pnK − `| < ε+ ε = 2ε.

In conclusione, limn→+∞ pn = `.

Page 56: lezioni di matematica

48 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Dim. del teorema di completezza. Sia {pn}n una successione di Cauchy for-mata da numeri reali. Dalla definizione di successione di Cauchy segue che{pn}n è necessariamente limitata.16 Sappiamo (si veda il Teorema 3.28) cheogni successione limitata possiede una sottosuccessione convergente, e chia-miamo ` tale limite. Dalla precedente Proposizione, tutta la successione{pn}n deve convergere a `, e questo conclude la dimostrazione.

Il nome di questo teorema è legato al fatto che gli spazi metrici in cui tuttele successioni di Cauchy sono necessariamente convergenti vengono chiamaticompleti.

16Lo studente si convinca di questa affermazione. Suggerimento: fissato ε = 1, tuttii numeri della successione, ad esclusione di un numero finito N , distano l’uno dall’altromeno di 1, e possono dunque essere inseriti in un intervallo di ampiezza 1. Allarghiamoora l’ampiezza di questo intervallo finché non vengano intrappolati tutti i primi N terminidella successione...

Page 57: lezioni di matematica

Capitolo 4

Serie numeriche

Per spiegare che cosa sia una serie numerica,1 pensiamo di raccogliere unaquantità finita di numeri reali, di ordinarli in un certo modo

p1, p2, . . . , pN

e di sommarli: p1 + p2 + . . . + pN . Si può abbreviare questa scritturaintroducendo il simbolo di sommatoria

∑:

N∑i=1

pi = p1, p2, . . . , pN .

Osservazione 4.1. L’indice i è una variabile muta. Qualunque altra letterapotrebbe essere usata senza alterare il valore della somma:

N∑i=1

pi =N∑j=1

pj =N∑k=1

pk = . . .

Questa operazione è chiara se sommiamo un numero finito di termi-ni, mentre diventa confusa se vogliamo sommare gli infiniti termini di unasuccessione.

Definizione 4.2. Sia {pn}n una successione di numeri reali. La serie asso-ciata a {pn}n è la successione {sn}n definita dalla formula

sn =n∑j=1

pj.

1Esistono anche altri tipi di serie: di funzioni, di vettori, ecc.

49

Page 58: lezioni di matematica

50 CAPITOLO 4. SERIE NUMERICHE

Useremo il simbolo∞∑n=1

pn,

o anche l’abbreviazione∑

n pn, per indicare la successione {sn}n. La succes-sione {sn}n prende il nome di successione delle somme parziali della serie.

Osservazione 4.3. Esplicitamente, s1 = p1, s2 = p1 + p2, s3 = p1 + p2 + p3,ecc. Osserviamo che, data una serie {sn}n, risulta pn = sn− sn−1, e pertantoè univocamente individuata la successione che genera la serie.

Osservazione 4.4. In esatta analogia con le successioni del capitolo pre-cedente, poco importa da quale valore parte l’indice della serie. Se è veroche

∞∑n=1

pn e∞∑n=0

pn

rappresentano due serie diverse, tuttavia è noto che la convergenza dellaprima equivale alla convergenza della seconda. Per questo motivo, capiteràdi far partire la serie dall’indice 0 o dall’indice 1, a seconda della convenienza.Ovviamente, certe volte la forma della serie impone dei limiti all’indice. Sipensi ad una serie come

∞∑n=2

1

n− 1,

il cui primo indice è n = 2 perché n = 1 annullerebbe il denominatore.

Osservazione 4.5. In relazione all’osservazione precedente, possiamo sfrut-tare il fatto che l’indice di somma è una variabile muta per effettuare un’o-perazione che sarà il cambiamento di variabile nella teoria dell’integrale diRiemann. Operiamo su un esempio: la serie

∞∑n=1

1

3n

si trasforma nella serie∞∑k=0

1

3k+1=

1

3

∞∑k=0

1

3k

mediante il cambiamento di indice k = n − 1. Per convincersene, scriviamo“con i puntini” le due serie:

∞∑n=1

1

3n=

1

3+

1

32+

1

33+ . . .

Page 59: lezioni di matematica

51

1

3

∞∑k=0

1

3k=

1

3

(1

30+

1

3+

1

32+

1

33+ . . .

)=

1

3+

1

32+

1

33+ . . .

Dunque una serie è semplicemente una successione, il cui termine gene-rale è costruito sommando i primi termini di un’altra successione. Si ponenaturalmente il problema della convergenza delle serie numeriche.

Definizione 4.6. La serie∑∞

n=1 pn converge al valore S se

S = limn→+∞

n∑j=1

pj,

o, con la notazione usata finora, se S = limn→+∞ sn. Con un leggero abusodi notazione, si scrive S =

∑∞n=1 pn.

L’angolo dello psichiatra. Gli studenti più attenti si saranno senz’altro ac-corti della notazione paradossale usata comunemente per indicare una serie.Siccome abbiamo definito una serie come la successione {

∑nk=1 pk}n, usare il

simbolo∑∞

n=1 pn significa confondere la serie con il suo limite! Se pensassimodi estendere questo abuso di notazione a tutte le successioni, ci accorgerem-mo immediatamente della pazzia compiuta: invece della successione {1/n}n,parleremmo della successione 0, il suo limite. La scrittura abbreviata

∑n pn

è già migliore, ma non esente da critiche. Possiamo confrontare quest’uso“leggero” dei simboli con l’espressione “la funzione x3”, che alla lettera nonè affatto una funzione, ma – al massimo – un numero reale. Probabilmentetutto ci ò è un retaggio della confusione fra successioni, numeri e funzioniche caratterizzava gli albori dell’analisi matematica.

Esiste una condizione necessaria e sufficiente per caratterizzare le serieconvergenti.

Teorema 4.7 (Criterio di convergenza di Cauchy). Una serie∑∞

n=1 pn èconvergente se e solo se, per ogni ε > 0 esiste un numero N ∈ N tale che

q∑n=p

|pn| < ε

per ogni p, q ∈ N tali che p > N , q > N .

Dim. È la traduzione, nel linguaggio delle serie, del teorema di completezzadi R.

Page 60: lezioni di matematica

52 CAPITOLO 4. SERIE NUMERICHE

A volte si riassume il contenuto di questo teorema dicendo che “le codedella serie sono piccole a piacere”.

Corollario 4.8. Se la serie∑∞

n=1 pn è convergente, allora limn→+∞ pn = 0.

Dim. Se la serie è convergente, il criterio di Cauchy garantisce che, fissatoarbitrariamente ε > 0, esiste N ∈ N tale che, in particolare,

k∑n=k−1

|pn| = |pk| < ε

per ogni k > N . Ma questa è la definizione del limite limn→+∞ pn = 0.

Questo corollario, letto in negativo, afferma che se il termine generale pndi una serie non tende a zero, allora la serie non può convergere. Ad esempio,la serie

∑nn−1n+2

non converge, dato che limn→∞n−1n+2

= 1. Purtroppo, non èpossibile invertire questo ragionamento: vedremo presto che la serie

∑n

1n2

converge, mentre la serie∑

n1nnon converge. Entrambe hanno tutavia un

termine generale tendente a zero.

Osservazione 4.9. Dato che una serie è semplicemente una successione par-ticolare, una serie può convergere o divergere. Nella divergenza sono inclusitanto la divergenza all’infinito, quanto l’oscillazione. Per esempio, la serie∑

n(−1)n oscilla fra i valori −1 e 0.

Esempio: la serie geometrica. Sia q ∈ [0,+∞) un numero fissato.Consideriamo la serie

∞∑n=0

qn = 1 + q + q2 + q3 + q4 + . . .

Ci chiediamo se esistano scelte della ragione q che portano ad una serieconvergente. Togliendo le parentesi, è facile convincersi che

(1− q)(1 + q + q2 + q3 + q4 + . . .+ qn

)= 1− qn+1.

Pertanto,

sn =n∑k=0

qk =1− qn+1

1− q.

La successione {sn}n delle somme parziali converge se e solo se limn→+∞ qn+1

esiste finito, e questo accade se se solo se 0 < q < 1. Inoltre, abbiamo ancheil valore della serie:

∞∑n=0

qn =1

1− q

Page 61: lezioni di matematica

53

per 0 < q < 1.

Esempio: le serie telescopiche. Vanno sotto tale nome le serie∑

n pn ilcui termine generale può essere scritto come

pn = qn − qn+1

per una scelta opportuna di {qn}n. È allora chiaro che

n∑k=1

pk =n∑k=1

qk − qk+1 = q1 − q2 + q2 − q3 + q4 − q5 + . . . = q1 − qk+1.

Si conclude subito che∞∑n=1

pn = limn→+∞

n∑k=1

pk = q1 − limn→+∞

qn+1. (4.1)

Una serie telescopica converge se e solo se limn→+∞ qn esiste finito. La seriedi Mengoli è un esempio di questa classe di serie:

∞∑n=1

1

n(n+ 1).

Poiché1

n(n+ 1)=

1

n− 1

n+ 1,

possiamo porre qn = 1/n e concludere da (4.1) che la serie di Mengoli convergea 1.

In generale, potrebbe non essere evidente fin dall’inizio che una serie ètelescopica. Di primo acchito, la serie

∞∑n=1

log(n+ 1)2

n(n+ 2)

non sembra molto telescopica. Usando però le proprietà dei logaritmi, vedia-mo che

log(n+ 1)2

n(n+ 2)= 2 log(n+ 1)− log n− log(n+ 2)

= [log(n+ 1)− log n]− [log(n+ 2)− log(n+ 1)].

La serie è telescopica con qn = log(n+1)−log n. Poiché qn → 0 per n→ +∞,da (4.1) deduciamo che questa serie converge a log 2.

Page 62: lezioni di matematica

54 CAPITOLO 4. SERIE NUMERICHE

4.1 Serie a termini positiviVanno sotto questo nome le serie i cui termini sono numeri maggiori o uguali azero. Queste serie presentano una forte peculiarità: o convergono o divergonoall’infinito. Infatti, se pn ≥ 0 per ogni n, allora

sn =n∑k=1

pk ≤n+1∑k=1

pk = sn+1,

e dunque la serie è monotona crescente. Sappiamo che una successione mo-notona o converge o diverge all’infinito, e questo giustifica la precedenteaffermazione sulle serie a termini positivi. In effetti, vale di più.

Proposizione 4.10. Sia∑

n pn una serie a termini positivi. Questa serieè convergente se e solo se la successione {sn}n delle sue somme parziali èlimitata dall’alto.

Dim. Infatti, sappiamo che {sn}n è monotona crescente. Dalla teoria vistanel capitolo precedente, {sn}n converge se e solo se supn |sn| < +∞, cioè see solo se esiste una costante C > 0 tale che sn ≤ C per ogni n.

Il principale strumento per l’analisi della convergenza delle serie a terminipositivi è il seguente teorema di confronto.

Teorema 4.11. Siano∑

n pn e∑

n qn sue serie a termini positivi. Suppo-niamo che pn ≤ qn per ogni n sufficientemente grande.

1. Se∑

n qn converge, allora anche∑

n pn converge.

2. Se∑

n pn diverge, allora anche∑

n qn diverge.

Dim. Nel primo caso, le somme parziali della prima serie sono più piccoledelle somme parziali della seconda serie, le quali per ipotesi restano limitate.Perciò saranno limitate anche le somme parziali della prima serie.

Nel secondo caso, le somme parziali della seconda serie sono maggiori dellesomme parziali della prima serie. Poiché queste ultime non sono limitate, nonlo saranno nemmeno quelle della serie

∑n qn.

Osservazione 4.12. Il criterio del confronto è destinato a fallire per le seriedi termini arbitrari. Ad esempio,

− 1

n<

1

n2,

ma la serie −∑

n1ndiverge (a −∞), mentre la serie

∑n

1n2 converge. Si veda

il Corollario 4.20.

Page 63: lezioni di matematica

4.1. SERIE A TERMINI POSITIVI 55

Corollario 4.13 (Criterio del confronto asintotico). Siano∑

n pn e∑

n qnsue serie a termini positivi. Supponiamo che

limn→+∞

pnqn

= ` ∈ (0,+∞).

Allora le due serie sono simultaneamente convergenti o divergenti.

Dim. Per l’ipotesi sul limite, esiste un numero N ∈ N tale che

`

2qn ≤ pn ≤

3

2`qn (4.2)

per ogni n > N . La conclusione segue immediatamente dal criterio diconfronto.

Per comprendere la potenza di questo criterio, applichiamolo all’analisidella serie

∞∑n=1

sin1

n2.

Innanzitutto, i termini della serie sono positivi, dal momento che 0 < 1/n <π/2 per ogni n ≥ 1 e la funzione seno è positiva nell’intervallo (0, π/2).Dal limite notevole limx→0

sinxx

= 1 deduciamo che la serie data ha lo stessocomportamento della serie

∞∑n=1

1

n2,

e presto imparareremo che questa serie è convergente. Il criterio del confrontoasintotico garantisce che anche la serie iniziale converge.

Osservazione 4.14. Se nel criterio del confronto asintotico risulta ` = 0,non è più possibile dedurre che le serie

∑n pn e

∑n qn hanno lo stesso compor-

tamento rispetto alla convergenza. Per convincerci di questo, consideriamopn = 1/n2 e qn = 1/n. Ovviamente limn→+∞ pn/qn = limn→+∞ 1/n = 0, maimpareremo presto che

∑n

1ndiverge, mentre

∑n

1n2 converge.

Non tutto è comunque perduto: se ` = 0, possiamo concludere che laconvergenza di

∑n qn implica la convergenza di

∑n pn. Infatti, per ` = 0

vale solo la seconda disuguaglianza di (4.2), perciò∑

n pn ≤ (3/2)`∑

n qn.2

2Siamo volutamente imprecisi: la conclusione rigorosa sarebbe che le somme parzialidella serie con pn sono maggiorate dalle somme parziali della serie con qn. Come sappiamo,il criterio asintotico non può garantire la (4.2) anche per i primi valori di n, e questopotrebbe invalidare la relazione

∑n pn ≤ (3/2)`

∑n qn.

Page 64: lezioni di matematica

56 CAPITOLO 4. SERIE NUMERICHE

4.2 Criteri di convergenzaMa esistono metodi generali per decidere se una data serie sia convergente?La risposta è ampiamente affermativa per le serie a termini positivi, ed so-lo parzialmente affermativa per le serie qualunque. Nel seguito, esporremoalcuni criteri classici per studiare la natura di una serie numerica.

Teorema 4.15 (Criterio della radice). Sia∑

n pn una serie a termini posi-tivi. Supponiamo che

limn→+∞

n√pn = L.

Se L < 1, allora la serie converge; se L > 1, allora la serie diverge. Il criterionon è applicabile se L = 1.

Dim. Supponiamo dapprima che L < 1. Preso ε−(1−L)/2, esiste un numeronaturale N tale che n

√pn < L + ε = (1 + L)/2 per ogni n > N . Elevando

questa diseguaglianza alla potenza n,

pn <

(1 + L

2

)n,

e poiché la serie geometrica∑∞

n=0

(1+L

2

)n è convergente3 dal criterio delconfronto concludiamo che

∑n pn converge. Se invece L > 1, prendiamo

ε = (L− 1)/2, e come prima arriviamo a

n√pn >

(1 + L

2

)n> 1

per ogni n > N . Quindi {pn}n non tende a zero, e la serie non può convergere.

Teorema 4.16 (Criterio del rapporto). Sia∑

n pn una serie a termini posi-tivi. Supponiamo che

limn→+∞

pn+1

pn= L.

Se L < 1, allora la serie converge; se L > 1, allora la serie diverge. Il criterionon è applicabile se L = 1.

Dim. Supponiamo dapprima che L < 1. Preso ε−(1−L)/2, esiste un numeronaturale N tale che pn+1/pn < L + ε = (1 + L)/2 per ogni n > N . Quindipn+1 < pn(1 + L)/2 per ogni n > N . Ma allora

pn <1 + L

2pn−1 <

(1 + L

2

)2

pn−2 < . . . <

(1 + L

2

)n−N−1

pN+1,

3Infatti 1+L2 < 1.

Page 65: lezioni di matematica

4.2. CRITERI DI CONVERGENZA 57

che possiamo scrivere come

pn <pN+1(

1+L2

)N+1

(1 + L

2

)n.

Ancora dal confronto con la serie geometrica convergente∑∞

n=0

(1+L

2

)n de-duciamo la convergenza di

∑n pn. Viceversa, per L > 1, preso ε = (L−1)/2,

ripetendo gli stessi ragionamenti arriviamo a

pn >pN+1(

1+L2

)N+1

(1 + L

2

)ned ancora una volta il termine generale pn non tende a zero.

Osservazione 4.17. Lo studente avrà notato che questi criteri sono sem-plicemente applicazioni del criterio del confronto con opportune serie geo-metriche. Le divergenze, invece, sono dedotte dal fatto che viene violata lacondizione necessaria per la convergenza di una serie. Intuitivamente, questofatto ci induce a sospettare che i due criteri non siano particolarmente fini neicasi meno accademici. Come anticipato, nel caso L = 1 nessuno dei criteri èefficace. Rimandiamo la disamina di questo fatto all’osservazione successiva.

Osservazione 4.18. Il criterio del rapporto, di solito, è di applicazione piùimmediata. Ormai sappiamo che in matematica non si fanno sconti, e pun-tualmente ciò accade anche in questa situazione. Si potrebbe mostrare cheil criterio della radice è più potente: quando è efficace, lo è anche il criteriodel rapporto. Quando non è conclusivo (per L = 1), anche il criterio delrapporto non porta ad alcuna conclusione. Per i dettagli, rimandiamo a [24].Volendo fare dell’ironia, né l’uno né l’altro sono criteri utili nella “pratica”.Risultano invece importanti nella teoria delle serie di potenze, da cui prendevita l’analisi matematica nel piano complesso.

Un criterio piuttosto efficace è il seguente, a dispetto della formulazionevagamente misteriosa.

Teorema 4.19 (Criterio di condensazione). Sia∑

n pn una serie a terminipositivi. Supponiamo che pn+1 ≤ pn per ogni n. Sotto tali ipotesi, la serie∑

n pn converge se e solo se converge la serie∑k

2kp2k .

Page 66: lezioni di matematica

58 CAPITOLO 4. SERIE NUMERICHE

Dim. Poiché stiamo lavorando con serie a termini positivi, ci basta dimo-strare che le somme parziali di

∑n pn e di

∑k 2kp2k sono simultaneamente

limitate o non limitate dall’alto. Siano

sn = p1 + p2 + . . .+ pn,

tk = p1 + 2p2 + . . .+ 2kp2k

le somme parziali delle due serie.Per n < 2k,

sn ≤ p1 + (p2 + p3) + . . .+ (p2k + . . .+ p2k+1−1)

≤ p1 + 2p2 + . . .+ 2kp2k

= tk

e quindi sn ≤ tk. Invece, Per N2k,

sn ≥ p1 + p2 + (p3 + p4) + . . .+ (p2k−1+1 + . . .+ p2k)

≥ 1

2p1 + p2 + 2p4 + . . .+ 2k−1p2k

=1

2tk

e quindi tk ≤ 2pn. Unendo le due conclusioni, le succesisoni delle sommeparziali {sn}n e {tk}k sono simultaneamente limitate oppure illimitate, equesto conclude la dimostrazione.

Corollario 4.20. Sia α ∈ R fissato. La serie∑

n1nα

converge se α > 1, ediverge se α ≤ 1.

Dim. Il caso α ≤ 0 è semplice, perché il termine generale non tende a zero.Applichiamo il criterio di condensazione, e ci riduciamo a studiare la serie∑

k

2k1

2kα=∑k

2(1−α)k.

Si tratta di una serie geometrica di ragione 21−α. Essa sarà convergente see solo se 21−α < 1, cioè se e solo se α > 1, e divergente all’infinito perα ≤ 1.

Osservazione 4.21. Il Corollario ci convince che i criteri del rapporto e dellaradice sono insoddisfacenti quando L = 1. Ad esempio, le due serie

∑∞n=1

1n

e∑∞

n=11n2 hanno entrambe L = 1 (per entrambi i criteri), ma la prima

diverge, mentre la seconda converge. La serie∑∞

n=11n

prende il nome di

Page 67: lezioni di matematica

4.2. CRITERI DI CONVERGENZA 59

serie armonica. La sua divergenza può essere mostrata anche direttamente.Chiamando al solito sn la somma dei suoi primi n termini, abbiamo

s1 = 1

s2 = 1 +1

2=

3

2

s3 =3

2+

1

3+

1

4>

3

2+

1

4+

1

4= 2

s4 = 2 +1

5+

1

6+

1

7+

1

8> 2 +

1

8+

1

8+

1

8+

1

8=

5

2

e in generale

s2n = 1 +1

2+ · · ·+ 1

n+

1

n+ 1+ · · ·+ 1

2n=

= sn +1

n+ 1+ · · ·+ 1

2n≥ sn +

1

2n+ · · ·+ 1

2n= sn +

1

2.

Raddoppiando quindi il numero degli addendi, la somma aumenta almeno diun termine 1/2. Deduciamo che |s2n − sn| ≥ 1/2, e quindi non può esseresoddisfatto il criterio di convergenza di Cauchy.

Questa serie ci consente un’osservazione di natura pratica. Volendo stu-diare al computer le serie, può essere molto fuorviante leggere le prime sommeparziali e trarne conclusioni sulla convergenza. Infatti, per la serie armonicasi ha

s1 = 1

s3 < 2

s7 < 3

s15 < 4.

Per arrivare a 10 bisogna sommare più di 1000 termini, e pre superare 20occorrono fpiù di un milione di addendi. Se si vuole arrivare a 100, che purenon è un segno inqeuivocabile della divergenza della serie, occorre sommarecirca 1030 termini! 4 È abbastanza evidente che questa quantità di addendisupera ampiamente le capacità di calcolo di molti personal computer.

Il punto è che le serie numeriche sono molto sensibili alle piccole pertur-bazioni dei loro termini. La serie

∞∑n=1

1

n1.01

41030 si scrive come 1 seguito da 30 zeri.

Page 68: lezioni di matematica

60 CAPITOLO 4. SERIE NUMERICHE

ha termini numericamente molto prossimi a quelli della serie armonica, manonostante questo è convergente. Il celebre filosofo francese Voltaire sugge-riva maliziosamente al matematico tedesco Gauss che prima di mettersi afare conti per tre giorni, è meglio controllare se non si possa usare qualcheragionamento per arrivare in porto in tre minuti.5

4.3 Convergenza assoluta e convergenza delleserie di segno alterno

Tutti i criteri esposti si applicano alle serie a termini positivi. 6 Ci sonocriteri di convergenza per le serie qualunque? Prima di rispondere – e larisposta non sarà del tutto soddisfacente – introduciamo il concetto di serieassolutamente convergente.

Definizione 4.22. Una serie∑

n pn è assolutamente convergente se∑

n |pn|è convergente.

Poiché |pn| ≥ 0, il concetto di serie assolutamente convergente è di perti-nenza delle serie a termini positivi. Inoltre, le serie assolutamente convergentisono convergenti.

Proposizione 4.23. Ogni serie assolutamente convergente è anche conver-gente.

Dim. Basta osservare che pn ≤ |pn| ed applicare il criterio del confronto.

Osservazione 4.24. La Proposizione non si inverte: vedremo che la serie

∑n

(−1)n

n

5K.F. Gauss, uno dei più importanti matematici dell’era moderna, aveva una caparbiainvidiabile nel mettersi a fare calcoli. Oggi lo potremmo definire simpaticamente uno“smanettone”. Ad onor del vero, certi problemi matematici possono essere risolti soloricorrendo a lunghe pagine di calcoli. Quello del matematico come uno scienziato cherisolve problemi difficili senza scrivere una sola riga di conti è un falso mito che lusingatutti gli studenti del primo anno. L’eleganza formale con cui vengono presentati i teoreminon dovrebbe far passare in secondo piano i sacrifici e gli sforzi dei matematici che li hannodimostrati per la prima volta.

6È giunto il momento di sfatare un mito: ovviamente questi criteri si applicano al-trettanto bene alle serie a termini negativi. L’importante è che tutti i termini della serieabbiano lo stesso segno.

Page 69: lezioni di matematica

4.3. CONVERGENZA ASSOLUTA E CONVERGENZA DELLE SERIE DI SEGNO ALTERNO61

converge, ma ovviamente non converge assolutamente (perché?). Questo nondiminuisce l’utilità della Proposizione 4.23. Non saremmo altrimenti in gradodi stabilire la convergenza della serie∑

n

sinn

n3,

visto che i suoi termini non sono tutti dello stesso segno. Usando per ò lamaggiorazione | sinn| ≤ 1, possiamo concludere che questa serie convergeassolutamente, e quindi anche in senso ordinario. 7

Una classe di serie a termine di segno variabile è quella delle serie a terminidi segno alterno.

Definizione 4.25. Una serie∑

n pn è detta serie a termini di segno alternoquando pnpn+1 ≤ 0 per ogni n.

Di fatto, la Definizione richiede che ogni coppia di termini successivi nellaserie sia costituita da due numeri di segno opposto (o eventualmente nulli).Il caso più frequente è quello delle serie del tipo∑

(−1)npn,

dove pn ≥ 0 per ogni n. Per queste serie esiste un potente criterio di conver-genza (ma non di divergenze). Premettiamo un lemma che corrisponde allaformula di integrazione per parti nel calcolo integrale.

Lemma 4.26 (Sommatoria per parti). Siano {pn}n e {qn}n due successioni.Poniamo s−1 = 0 e

sn =n∑k=0

pk

per n ≥ 0. Se 0 ≤ m ≤ n sono numeri naturali, alloram∑k=n

pkqk =m−1∑k=n

sk(qk − qk+1) + smqm − sn−1qn. (4.3)

Dim.m∑k=n

pkqk =m∑k=n

(sk − sk−1)qk =m∑k=n

skqk −m−1∑k=n−1

skqk+1

e l’ultima espressione è uguale a (4.3).7A volte conviene dire che una serie converge semplicemente quando essa converge

secondo la definizione generale. In questo modo, si usa un aggettivo per distinguere laconvergenza dalla convergenza assoluta.

Page 70: lezioni di matematica

62 CAPITOLO 4. SERIE NUMERICHE

Teorema 4.27 (Criterio di Leibniz). Supponiamo che

1. le somme parziali {sn}n di∑

n pn formino una successione limitata;

2. q0 ≥ q1 ≥ q2 ≥ . . .;

3. limn→+∞ qn = 0.

Allora∑

n pnqn converge.

Dim. ScegliamoM > 0 tale che |sn| ≤M per ogni n. Fissato arbitrariamenteε > 0, per l’ipotesi 3 esiste un numero naturale N tale che qN ≤ ε/(2M).Per N ≤ n ≤ m, dal Lemma precedente ricaviamo∣∣∣∣∣

m∑k=n

pkqk

∣∣∣∣∣ =

∣∣∣∣∣m−1∑k=n

sk(qk − qk+1) + smqm − sn−1qn

∣∣∣∣∣≤M

∣∣∣∣∣m−1∑k=n

(sk − sk+1) + qm + qn

∣∣∣∣∣ = 2Mqn ≤ 2MqN = ε.

Questo dimostra che la serie∑

n pnqn soddisfa la condizione di Cauchy, equindi converge.

Corollario 4.28. Supponiamo che

1. |c1| ≥ |c2| ≥ |c3| ≥ . . .;

2. c2n−1 ≥ 0, c2n ≤ 0;

3. limn→+∞ cn = 0.

Allora∑

n cn converge.

Dim. Applicare il Teorema precedente con pn = (−1)n+1 e qn = |cn|.

Questo corollario garantisce ad esempio che∑

n(−1)n

nconverge. poiché

|cn| = 1/n è decrescente e tende a zero. Si noti il contrasto con la convergenzaassoluta, che in questo caso non sussiste.

Esistono “infiniti” criteri di convergenza e/o divergenza per le serie (preva-lentemente a termini positivi). In questo breve capitolo ne abbiamo discussialcuni estremamente classici. Lo studente interessato potrà trovarne altriin [21] e nei testi classici di analisi matematica come [16]. I testi più recentisembrano dare molto meno peso a questi criteri, dal momento che sono tuttiriconducibili al criterio di confronto (eventualmente asintotico).

Page 71: lezioni di matematica

Capitolo 5

Limiti di funzioni e funzionicontinue

Con questo capitolo, lasciamo il mondo delle successioni, cioè delle funzio-ni definite sul dominio N, ed entriamo in quello delle funzioni reali di unavariabile reale. Vedremo che anche per queste funzioni è sensato pensare aun concetto di limite, ed anzi c’è una maggiore flessibilità. Come lo stu-dente avrà osservato, i limiti delle successioni si calcolano solo per l’indicen → +∞. Parlando in termini estremamente imprecisi, questo non ci sor-prende più di tanto. D’altronde, se lo spirito dei limiti è quello di vedere cosasuccede quando una variabile si avvicina a piacere a un valore, una variabilen ∈ N non può avvicinarsi a piacere a un numero reale. Invece, una variabilereale x può senza dubbio essere vicina a piacere a qualunque altro numeroreale.

5.1 Limiti di funzioni come limiti di successioni

Definizione 5.1. Sia f : (a, b) → R una funzione, e sia x0 un punto diaccumulazione di (a, b).1 Diremo che limx→x0 f(x) = L, o che f(x) → Lper x → x0, se limn→+∞ f(xn) = L per ogni successione {xn} di numerixn ∈ (a, b) con limn→+∞ xn = x0 e xn 6= x0 per ogni n.

Logicamente parlando, questa definizione è rigorosa: sappiamo calcola-re i limiti di succesioni e questo è tutto quello che la definizione richiede.Confrontando con la definizione di limite per successioni, troviamo imme-

1Non è una svista, x0 potrebbe essere uno degli estremi del dominio di f , anche se fnon è definita per questi due valori.

63

Page 72: lezioni di matematica

64 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

diatamente una diversa caratterizzazione dei limiti di funzioni.2 Per inciso,verificare una relazione di limite con la Definizione 5.1 è praticamente impos-sibile. Vedremo fra poco che la condizione (ii) del seguente teorema rende leverifiche più agevoli.

Teorema 5.2. Siano f e x0 come nella Definizione. Sono equivalenti

(i) limx→x0 f(x) = L;

(ii) per ogni ε > 0 esiste δ > 0 tale che |f(x) − L| < ε per ogni x ∈ (a, b)tale che 0 < |x− x0| < δ.

Dim. Supponiamo che sia vera la (i) ma che la (ii) sia falsa. Allora esisteε > 0 ed esiste una successione {xn} tale che xn → x0, xn 6= x0, ma |f(xn)−L| ≥ ε. Questà è una contraddizione con l’ipotesi (i), e perciò anche (ii)deve essere vera. Viceversa, supponiamo che sia vera (ii) e dimostriamo la(i). Sia {xn} una qualunque successione di elementi di (a, b), distinti da x0

e tali che xn → x0. Fissiamo ε > 0 e sia δ > 0 il numero la cui esistenzaè garantita dall’ipotesti (ii). Definitivamente, 0 < |xn − x0| < ε, e dunque|f(xn)− L| < ε. Questo significa esattamente che limn→+∞ f(xn) = L.

Invitiamo lo studente ad osservare e memorizzare la richiesta “xn 6= x0” el’equivalente 0 < |x − x0|. Entrambe significano che, nell’effettuare l’opera-zione di limite per x→ x0, possiamo (e dobbiamo) trascurare completamentetutto ciò che avviene nel punto x0. Nel punto x0 a cui tende la x la funzione fpotrebbe tranquillamente non essere definita. Ma anche se lo fosse, il valoref(x0) non importerebbe nulla. Per esempio, le due funzioni

f(x) = x ∀x ∈ R

e

g(x) =

{x, x 6= 0

1, x = 0

assumono valori diversi in x0 = 0, e tuttavia limx→x0 f(x) = limx→x0 g(x) =0. L’Autore di [13] sottolinea che la richiesta “|x−x0| > 0” potrebbe tranquil-lamente essere omessa, perché le funzioni che in questo modo non avrebberolimite sarebbero “senza importanza”. Chi scrive rispetta ovviamente questopunto di vista, ma non lo condivide. Il concetto di limite sembra infattiparticolarmente significativo proprio perché è applicabile in quei punti vici-ni a piacere al dominio di definizione (i cosiddetti punti di accumulazione

2In certi testi italiani, il prossimo teorema viene chiamato teorema ponte. Non avendomai capito bene questa terminologia, preferiamo evitarla.

Page 73: lezioni di matematica

5.1. LIMITI DI FUNZIONI COME LIMITI DI SUCCESSIONI 65

per il dominio di definizione) ma non necessariamente appartenenti al domi-nio medesimo. Quindi, una scrittura come limx→0+

1x

= +∞ perderebbe disignificato.

Osservazione 5.3. È fondamentale che lo studente capisca il seguente fatto:se esiste un δ > 0 come nel punto (ii) del Teorema precedente, anche tutti inumeri positivi δ < δ vanno bene. Nella pratica, questo significa che possiamosempre considerare restrizioni come δ ≤ 1 quando verifichiamo un limite. Ineffetti, la dimostrazione di limite non pretende che si individui il miglioreδ > 0 che verifichi le richieste.

Per chiarire come si applica la definizione di limite, dimostriamo che perogni a > 0

limx→a

√x =√a.

Infatti, consideriamo la quantità√x −√a; moltiplicando e dividendo per√

x+√a si ottiene3

∣∣√x−√a∣∣ =|x− a|√x+√a<|x− a|√

a.

Fissato allora ε > 0, si avrà |√x−√a| < ε non appena x ≥ 0 e |x−a| < ε

√a;

la relazione (ii) del Teorema sarà allora verificata con δ = ε√a. Osserviamo

che il risultato vale anche per a = 0, con una diversa dimostrazione. Infatti,|√x−√

0| =√x < ε non appena 0 ≤ x < ε2. Basterà scegliere δ = ε2.

Lo studente ha certamente notato che il valore del limite altro non è cheil valore assunto da

√x quando x = a. Insomma, sarebbe bastato sostituire

x = a nella funzione√·. Certamente non è un caso, e capiremo nel capitolo

successivo tutte le ragioni di questa apparente coincidenza.

Osservazione 5.4. Una definizione più generale di limite è la seguente. Siaf : E → R una funzione, definita sull’insieme E ⊂ R. Sia x0 è un punto diaccumulazione di E; diciamo che

limx→x0x∈E

f(x) = L

se, per ogni successione {xn} di elementi xn ∈ E, escluso al più x0 stes-so, convergente a E, accade che limn→+∞ f(xn) = L. Oppure, in manie-ra equivalente, se per ogni ε > 0 esiste δ > 0 tale che, per ogni x ∈E ∩ ((x0 − δ, x0 + δ) \ {x0}), accade che |f(x)− L| < ε.

3Aumentando il denominatore, la frazione diminuisce. Poiché√x+√a >√a, è valida

l’ultima disuguaglianza.

Page 74: lezioni di matematica

66 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Questa definizione si riduce alle precedenti quando E è un intervallo, econtiene automaticamente i limiti per x → ∞, ma in un corso elementarec’e’ il rischio che l’eleganza di questa definizione non venga apprezzata.

Introduciamo ora i limiti all’infinito. Vediamo come si esprimono lecorrispondenti definizioni.

Definizione 5.5. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Diremo chelimx→x0 f(x) = +∞ se per ogni K > 0 esiste δ > 0 tale che f(x) > Kper ogni x ∈ (x0 − δ, x0 + δ).

Definizione 5.6. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Diremo chelimx→x0 f(x) = −∞ se per ogni K > 0 esiste δ > 0 tale che f(x) < −Kper ogni x ∈ (x0 − δ, x0 + δ).

Definizione 5.7. Sia f : (a,+∞)→ R una funzione definita su un intervalloillimitato a destra.4 Diremo che limx→+∞ f(x) = L ∈ R se per ogni ε > 0esiste M > 0 tale che |f(x)− L| < ε per ogni x > M .

Definizione 5.8. Sia f : (−∞, b)→ R una funzione definita su un intervalloillimitato a sinistra.5 Diremo che limx→−∞ f(x) = L ∈ R se per ogni ε > 0esiste M > 0 tale che |f(x)− L| < ε per ogni x < −M .

Definizione 5.9. Sia f : (a,+∞)→ R una funzione definita su un intervalloillimitato a destra. Diremo che limx→+∞ f(x) = +∞ ∈ R se per ogni K > 0esiste M > 0 tale che f(x) > K per ogni x > M .

Definizione 5.10. Sia f : (a,+∞) → R una funzione definita su un inter-vallo illimitato a destra. Diremo che limx→+∞ f(x) = −∞ ∈ R se per ogniK > 0 esiste M > 0 tale che f(x) < −K per ogni x > M .

Ripetiamo che le definizioni scritte qui sopra non sono definizioni indi-pendenti dalla 5.1. Le abbiamo riportate solo per convenienza, ed invitiamolo studente a formularle con il linguaggio della Definizione 5.1.

Concludiamo con la definizione di limiti per eccesso e per difetto.

Definizione 5.11. Sia f : (a, b)→ R e sia x0 ∈ (a, b). Diremo che

limx→x0−

f(x) = L

se per ogni ε > 0 esiste δ > 0 tale che |f(x)−L| < ε per ogni x ∈ (x0−δ, x0).Analogamente, diremo che

limx→x0+

f(x) = L

se per ogni ε > 0 esiste δ > 0 tale che |f(x)−L| < ε per ogni x ∈ (x0, x0 +δ).4Ricordiamo che (a,+∞) = {x ∈ R | x > a}.5Ricordiamo che (−∞, b) = {x ∈ R | x < b}.

Page 75: lezioni di matematica

5.2. TRADUZIONE DEI TEOREMI SULLE SUCCESSIONI 67

La differenza rispetto alla definizione completa di limite è che alla x èpermesso di avvicinarsi a x0 solo per valori minori oppure maggiori di x0

stesso.La seguente proposizione afferma che una funzione ha limite se, e soltanto

se, esistono finiti ed uguali i limiti da destra e da sinistra.

Proposizione 5.12. Sia f : (a, b)→ R e sia x0 ∈ (a, b). Sono equivalenti

1. limx→x0 f(x) = L

2. limx→x0− f(x) = limx→x0+ f(x) = L.

Dim. È chiaro che se il limite esiste, a maggior ragione esistono i due limitidirezionali, e coincidono con il valore del limite. Viceversa, supponiamo chei due limiti direzionali esistano e coincidano: sia L il valore comune di questidue limiti. Dalle definizioni, fissato ε > 0, esistono δ− > 0 e δ+ > 0 tali che|f(x) − L| < ε se x0 − δ− < x < x0 e |f(x) − L| < ε se x0 < x < x0 + δ+.Definiamo δ = min{δ−, δ+}. Allora, qualunque sia x0 ∈ (x0−δ, x0 +δ)\{x0},risulta |f(x) − L| < ε. Poiché ε > 0 è arbitrario, questo dimostra chelimx→x0 f(x) = L.

Osservazione 5.13. La precedente Proposizione è piuttosto intuitiva. Do-potutto, ci sono solo due modi di avvicinarsi ad un punto: da sinistra o dadestra. E se il comportamento durante l’avvicinamento da sinistra coincidecon il comportamento avvicinandosi da destra, è naturale credere che il limi-te debba esistere. Il discorso cambia radicalmente in dimensione maggiore ouguale a due. Già nel piano cartesiano, esistono infiniti modi di avvicinarsiad un punto: lungo una retta, lungo una spirale, “saltando” da una parteall’altra, ecc. Questo fa presagire che lo studio dei limiti per funzioni di dueo più variabili sia alquanto complicato, e che l’avvicinamento lungo direzioniprivilegiate non basterà mai a descrivere interamente i limiti.

5.2 Traduzione dei teoremi sulle successioniLa Definizione 5.1 è come la chiave di un codice segreto: ci permette ditradurre nel linguaggio delle funzioni le proprietà dei limiti viste per le suc-cessioni.6 Ne enunciamo alcune, con l’avvertenza che si tratta solo di alcunidei casi possibili per le funzioni. Per comodità, diamo gli enunciati per limitial finito, ma enunciati corrispondenti valgono per i limiti all’infinito.

6In questo senso, le successioni sono sufficienti a caratterizzare tutti i limiti delle funzionireali di una variabile reale. Non si tratta di una banalità, visto che concettualmente i limitidi funzione diventano un caso speciale dei limiti di successione. Al fondo c’è una proprietàtopologica di R che non abbiamo la possibilità di discutere in queste pagine.

Page 76: lezioni di matematica

68 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Teorema 5.14 (Unicità del limite). Sia f : (a, b) → R e sia x0 ∈ [a, b]. Selimx→x0 f(x) = L1 e limx→x0 f(x) = L2, allora L1 = L2.

Teorema 5.15 (Limitatezza locale). Sia f : (a, b) → R e sia x0 ∈ [a, b]. Seesiste finito il limite limx→x0 f(x), allora f è localmente limitata vicino a x0.Più esplicitamente, esiste un intorno I di x0 ed esiste un numero C > 0 taliche |f(x)| < C per ogni x ∈ I.

Teorema 5.16. Sia f : (a, b)→ R e sia x0 ∈ [a, b]. Se limx→x0 f(x) = L > 0,allora esiste un intorno U di x0 in cui f > 0. Se f ≥ 0 in un intorno di x0

e se esiste il limx→x0 f(x) = L, allora L ≥ 0.

Teorema 5.17 (Due carabinieri). Siano f , g ed h tre funzioni definite in(a, b), e sia x0 ∈ [a, b]. Supponiamo che, per ogni x ∈ (a, b), risulti g(x) ≤f(x) ≤ h(x). Se limx→x0 g(x) = limx→x0 h(x) = L, allora limx→x0 f(x) = L.

Teorema 5.18. Sia f : (a, b)→ R una funzione monotona (crescente oppuredecrescente).

(i) Se f è crescente, allora

limx→b−

f(x) = supx∈(a,b)

f(x), limx→a+

f(x) = infx∈(a,b)

f(x).

(ii) Se f è decrescente, allora

limx→a+

f(x) = supx∈(a,b)

f(x), limx→b−

f(x) = infx∈(a,b)

f(x).

5.3 Raccolta di limiti notevoliProposizione 5.19. Valono le seguenti relazioni di limite.

limx→0

sinx

x= 1 (5.1)

limx→0

1− cosx

x2=

1

2(5.2)

limx→0

tanx

x= 1 (5.3)

limx→0

(1 + x)1/x = e (5.4)

limx→0

ex − 1

x= 1 (5.5)

limx→0

log(1 + x)

x= 1 (5.6)

Page 77: lezioni di matematica

5.3. RACCOLTA DI LIMITI NOTEVOLI 69

OP

TQ

Figura 5.1: Il limite notevole limx→0+sinxx

= 1

Dim. Il primo limite ha una dimostrazione dal sapore geometrico. Innazi-tutto, la funzione x 7→ sinx

xè pari (lo studente lo verifichi secondo la defini-

zione), e pertanto ci basterà dimostrare il limite notevole per x → 0+. Siax > 0 un angolo “piccolo”. Dalla definizione geometrica di sinx, discendeche sinx ≤ x ≤ tanx.7 Nella figura 5.1, Q è il punto di intersezione fra lacirconferenza e il segmento OT , x è la lunghezza dell’arco PQ, tanx quel-la del segmento TP . Invece sinx è la lunghezza del segmento che scendeperpendicolarmente dal punto Q fino ad incontrare il segmento OP . Poichésinx > 0 per 0 < x < π

2, possiamo dividere queste disuguaglianze per sinx e

ottenere1 ≤ x

sinx≤ 1

cosx,

e il teorema dei due carabinieri garantisce che limx→0+x

sinx= 1.

Il secondo limite notevole si ottiene dal primo:

1− cosx

x2=

(1− cosx)(1 + cos x)

x2(1 + cos x)=

1− cos2 x

x2(1 + cos x)=

sin2 x

x2(1 + cos x).

7Si tratta di una dimostrazione in cui molto è lasciato all’intuizione geometrica, edunque poco apprezzata dai bourbakisti.

Page 78: lezioni di matematica

70 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Quindi

limx→0

1− cosx

x2= lim

x→0

(sinx

x

)2

limx→0

1

x2(1 + cos x)=

1

2.

Il terzo limite è quasi ovvio, basta scrivere tanx = sinxcosx

ed usare il primolimite notevole.

Il quarto limite è di solito usato come definizione del numero di Neperoe. Spesso lo si trova scritto nella forma equivalente

limx→±∞

(1 +

1

x

)x= e.

Gli ultimi due limiti, fra loro equivalenti (suggerimento: cambiare la variabile1 + x = et), possono essere dimostrati solo utilizzando la definizione dellafunzione esponenziale. Non avendo tempo di discutere la costruzione dellepotenze reali con base reale, ci accontentiamo di sapere il valore dei limiti.

5.4 Continuità

È inutile sottolineare che non sempre una funzione ha limite. La funzionef : [0, 1]→ R definita da

f(x) =

{0, x ∈ Q1, x ∈ R \Q

non ha limite per x→ 1. Infatti, ogni intorno di 1 contiene infiniti valori dix in cui f(x) = 0, e infiniti valori di x in cui f(x) = 1. 8

D’altronde, anche se il limite esiste, può non aver niente a che vederecon il valore della funzione in quel punto. Abbiamo proprio sottolineato chel’operazione di limite ignora per definizione il valore della funzione nel puntoverso cui ci stiamo avvicinando.

Definizione 5.20. Sia f : [a, b] → R una funzione reale di una variabilereale, e sia x0 ∈ [a, b]. Diciamo che f è continua nel punto x0 se per ogniε > 0 esiste δ > 0 tale che |f(x)−f(x0)| < ε per ogni x ∈ (x0−δ, x0+δ)∩[a, b].Diremo che f è continua in [a, b] se è continua in ogni punto x0 ∈ [a, b].

8Sempre per lo studente più curioso, risulta lim infx→1− f(x) = 0 < 1 =lim supx→1− f(x) e quindi il limite non esiste.

Page 79: lezioni di matematica

5.4. CONTINUITÀ 71

Confrontando questa definizione con quella di limite, abbiamo una carat-terizzazione della continuità in termini di limiti.9

Teorema 5.21. Sia f : [a, b] → R una funzione reale di una variabile reale,e sia x0 ∈ [a, b]. La funzione f è continua in x0 se e solo se limx→x0 f(x) =f(x0).

Corollario 5.22. Una funzione f è continua in un punto x0 appartenenteal suo dominio se e solo se

limx→x0−

f(x) = limx→x0+

f(x) = f(x0).

Dalle regole per il calcolo algebrico dei limiti, segue immediatamente chetutte le funzioni polinomiali, cioè le funzione rappresentate da un polinomio∑N

i=1 aixi di qualsiasi grado N ≥ 1 sono continue in ogni punto di R. Infatti,

la somma e il prodotto di funzioni continue sono continue. Sono inoltrecontinue praticamente tutte le funzioni elementari che lo studente conosce:seno, coseno, esponenziali, logaritmi.

Osservazione. Capita spesso di sentir dire, anche da persone autorevoli,che la funzione x 7→ 1/x è discontinua nel punto x = 0. Ora, tale funzionenon è definita in x = 0, ed è pertanto imbarazzante applicare la definizionedi continuità in questo caso. Di solito, non si fanno affermazioni relative adoggetti inesistenti. Per esempio, è vero o falso che i mandarini alati hannoquattro ruote motrici?

È chiaro che questa discussione ha una natura filosofica: è lecito attribuireproprietà a ciò che non esiste? Io credo che non si possa parlare razionalmentedel nulla, ma capisco anche l’altra posizione: il nulla non possiede alcunaproprietà, proprio perché è nulla. Quindi, una funzione non definita in unpunto non possiede la continuità, e dunque è discontinua.10

9Mentre la Definizione 5.20 ha validità generale, il teorema di caratterizzazione nonpuò coprire una caso particolare: quello di una funzione come f : (0, 1) ∪ {2} → R. Cichiediamo che cosa significhi dire che f è continua in x0 = 2. La Definizione 5.20 ci diceche nei fatti f è sempre continua in tale punto, qualunque “sia il valore di f(2). Mentreil teorema di caratterizzazione è privo di senso: non si può far avvicinare x a 2 restandonel dominio di f . In altri termini, non ha senso scrivere limx→2 f(x). Sembra che ladefinizione” di continuità proposta in [13, Definizione 7.1] risenta di questa scorrettezza.In ogni caso, per un corso come il nostro, il dominio delle funzioni non contiene puntiisolati, ed il teorema di caratterizzazione contiene una condizione necessaria e sufficienteper la continuità.

10Molti dei più celebri scienziati erano anche filosofi, e queste diatribe hanno a volterallentato il progresso scientifico. Nelle scienze umane, la sovrapposizione fra progressoscientifico e insegnamento religioso ha generato molte pagine buie della storia del pensieromoderno. In questo senso, una disciplina astratta come la matematica ha sempre godutodi maggiore libertà.

Page 80: lezioni di matematica

72 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Torniamo al nostro programma. Abbiamo osservato che effettuando lequattro operazioni algebriche su funzioni continue, otteniamo ancora funzionicontinue. Ma che accade se componiamo due funzioni continue? La rispostaè che la composizione è ancora una funzione continua. A questo risultatopremettiamo una Proposizione sul calcolo dei limiti.

Proposizione 5.23 (Cambiamento di variabile nei limiti). Siano date duefunzioni f : (a, b)→ R e g : (c, d)→ R, e siano x0 ∈ (a, b), y0 ∈ (c, d). Se

(i) g(y)→ L per y → y0, y ∈ (c, d);

(ii) f(x)→ y0 per x→ x0, x ∈ (a, b);

(iii) o g(y0) = L o f(x) 6= y0 per ogni x 6= x0

allora limx→x0 g(f(x)) = L.

Dim. Dimostriamo la Proposizione nel caso in cui valga la seconda alterna-tiva in (iii). Fissiamo ε > 0. Per (i) esiste σ > 0 tale che se y ∈ (c, d),y 6= y0, |y−y0| < σ, allora |g(y)−L| < ε. D’altra parte se si ha f(x) ∈ (c, d),per la (iii) f(x) 6= y0 e per la (ii) esiste δ > 0 tale che se 0 < |x − x0| < δallora |f(x)− y0| < σ. Dunque in definitiva se x ∈ (a, b) ∩ f−1(c, d), x 6= x0,|x− x0| < δ, allora |g(f(x))− L| < ε. Per l’arbitrarietà di ge > 0, la tesi èdimostrata. Lasciamo al lettore la dimostrazione, pi ù facile, nel caso in cuig(y0) = L. Notiamo che questo significa che g è continua in y0.

Un commento sulla Proposizione. Perché abbiamo dovuto introdurre l’al-ternativa in (iii)? La ragione sta tutta nella condizione “0 < |x − x0| < δ”della definizione di limite. In altre parole, non ci interessiamo al valore dellafunzione nel punto. Quando facciamo la composizione g◦f e facciamo tende-re x a x0, per poter usare l’ipotesi (i) dobbiamo accertarci che y = f(x) 6= y0.In caso contrario, potrebbe accadere un fenomeno bizzarro. Consideriamo lafunzione costante f : x 7→ y0, e la funzione

g(y) =

{0, y 6= y0

1, y = y0.

Quindi, la funzione composta g ◦ f è la funzione costante che vale ovunque1. Si ha f(x) → y0 per x → x0, g(y) → 0 per y → y0, ma nessuna dellealternative in (iii) è soddisfatta. E infatti limx→x0 g(f(x)) = 1 6= 0.

Teorema 5.24. Siano f : (a, b) → R e g : (c, d) → R due funzioni, e sianox0 ∈ (a, b), y0 ∈ (c, d). Se f è continua in x0 e se g è continua in y0 = f(x0),allora g ◦ f è continua in g(y0).

Page 81: lezioni di matematica

5.5. INFINITESIMI ED INFINITI EQUIVALENTI 73

Dim. Basta applicare la Proposizione precedente.

Il problema della continuità della funzione inversa si pone in termini ana-loghi: data una funzione continua ed invertibile, è vero che la funzione inversaè continua? Nei limiti del nostro corso, la risposta è affermativa.11

Iniziamo da un’osservazione molto intuitiva. Omettiamo la dimostrazio-ne rigorosa, ma invitiamo caldamente lo studente a convincersi con qualchedisegno della verità di quanto affermato.

Lemma 5.25. Sia f : (a, b)→ R una funzione invertibile e continua in tuttii punti di (a, b). Allora f è strettamente monotona.

L’idea che si nasconde dietro questo Lemma è la seguente: se f non fos-se strettamente monotona, dovrebbe “andare un po’ su e un po’ giù”. Adesempio, dovrebbe crescere e poi decrescere. Siccome f è continua, neces-sariamente esisterebbe una retta orizzontale che interseca il grafico di f inalmeno due punti distinti. Ciò è in contraddizione con l’invertibilità di f . Nesegue che f o “va sempre su” o “va sempre giù”, cioè è strettamente mono-tona. Questo discorso non sostituisce una vera dimostrazione, ma possiamodire che non servirebbe aggiungere molto per ottenerne una. Lo studenteinteressato troverà i dettagli in [11].

Teorema 5.26. Sia f : (a, b) → R una funzione strettamente monotona econtinua in tutti i punti di (a, b). Allora l’inversa f−1, definita sull’intervallo(c, d), c = inf{f(x) | x ∈ (a, b)}, d = sup{f(x) | x ∈ (a, b)}, è continua intutti i punti di (c, d).

Per brevità, nell’enunciato siamo stati un po’ imprecisi. Se f è stret-tamente decrescente, l’intervallo (c, d) ha un aspetto insolito, ad esempio(5, 3). In questo caso, lo studente deve pensare di scambiare i due estremidell’intervallo, cioè deve prendere (d, c).

5.5 Infinitesimi ed infiniti equivalenti

Anche per le funzioni è possibile parlare di infinitesimi ed infiniti equivalenti.Dovrebbe essere chiaro, a questo punto, che le definizioni richiedono qualchesottigliezza.

11Mentre il teorema di continuità delle funzioni composte è un teorema valido in generale,quello di continuità della funzione inversa non lo è. Se studiassimo funzioni definite suinsiemi più “grandi” di R occorrerebbero ipotesi supplementari.

Page 82: lezioni di matematica

74 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Definizione 5.27. Siano f e g due funzioni, definite almeno in un intornobucato (x0−δ, x0 +δ)\{x0} di un punto x0. Supponiamo che limx→x0 f(x) =limx→x0 g(x) = 0 (rispettivamente ∞). Diciamo che f e g sono infinitesimi(rispettivamente infiniti) equivalenti per x→ x0 se

limx→x0

f(x)

g(x)= 1,

e scriviamof � g per x→ x0.

Osservazione 5.28. È indispensabile specificare che l’equivalenza sussisteper x→ x0. Ad esempio f(x) = x(x−1)4 e g(x) = x(x−1)2 sono infinitesimiequivalenti per x→ 0 ma non per x→ 1.

Osservazione 5.29. A costo di sembrare ottusi, ribadiamo con forza che ilquoziente f(x)/g(x) deve tendere a 1: nessun altro numero permetterebbela sostituzione degli infinitesimi ed infiniti equivalenti nel calcolo dei limiti(vedi sotto).

Osservazione 5.30. Siamo stati pedanti nella definizione precedente, alme-no nel caso degli infinitesimi. In effetti, avremmo potuto supporre addiritturache f e g fossero continue in x0. Infatti, le funzioni

f(x) =

{f(x) se x 6= x0

0 se x = x0

e

g(x) =

{g(x) se x 6= x0

0 se x = x0

sono continue in x0, e si verifica facilmente che f � g se e solo se f � g perx→ x0. Nel caso degli inifiniti, è ovviamente insensato pretendere che f e gsiano continue se entrambe divergono all’infinito.

Osservazione 5.31. È chiaro che definizioni simili si possono dare per x→±∞. Ovviamente, la due funzioni dovranno essere definite (almeno) in unintervallo del tipo (a,+∞) oppure (−∞, b). Ad esempio, f(x) = sin(1/x) eg(x) = 1/x sono infinitesimi equivalenti per x→ +∞.

Vale infine un criterio di sostituzione degli infinitesimi (e degli infiniti)equivalenti, che lo studente potrà ricostruire per esercizio a partire dall’ana-logo visto per le successioni (Proposizione 3.25).

Page 83: lezioni di matematica

5.6. TEOREMI FONDAMENTALI PER LE FUNZIONI CONTINUE 75

Per convincere lo studente che il principio di sostituzione degli infinitesimi(ed infiniti) equivalenti non vale in ambito additivo, consideriamo il classicolimite

limx→0

sinx− xx3

.

Impareremo presto che tale limite vale −1/6. Ma questo conta poco: voglia-mo invece mostrare che sbaglieremmo, se pensassimo di calcolarlo sostituendosinx con x. Infatti, arriveremmo alla situazione assurda

limx→0

sinx− xx3

= limx→0

x− xx3

= limx→0

0

x3.

Ma perché stiamo sbagliando? Apparentemente, dovremmo concludere cheil limite esiste e vale zero. Invece questo ragionamento non sta in piedi, e cene rendiamo conto se proviamo a capire i passaggi nascosti:

limx→0

sinx− xx3

= limx→0

x sinxx− x

x3= lim

x→0

x(

sinxx− 1)

x3= lim

x→0

sinxx− 1

x2,

e questo limite è ancora una forma di indecisione [0/0]. Insomma, possiamodire un po’ paradossalmente, che il principio di sostituzione resta “quasi”vero, ma non serve a concludere!

5.6 Teoremi fondamentali per le funzioni con-tinue

A parte le traduzioni dei teoremi sui limiti, le funzioni continue godono diproprietà peculiari, alcune abbastanza intuitive. Se lo studente torna con lamemoria alle parole certamente pronunciate dal suo professore di matema-tica alle scuole superiori, “le funzioni continue sono quelle che si disegnanosenza staccare la penna dal foglio”, gli sembrerà quasi ovvio che una fun-zione continua che parte negativa e arriva positiva debba necessariamenteannullarsi.

Teorema 5.32 (Teorema degli zeri). Sia f : [a, b] → R una funzione conti-nua. Se f(a)f(b) < 0, allora esiste (almeno) un punto x0 ∈ (a, b) tale chef(x0) = 0.

Dim. Supponiamo per comodità che f(a) < 0 e f(b) > 0. Il caso f(a) > 0 ef(b) < 0 è identico. Definiamo l’insieme

E = {x ∈ [a, b] | f(x) < 0}.

Page 84: lezioni di matematica

76 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Ovviamente E contiene il punto a, ed è limitato dall’alto poiché b /∈ E.Perciò esiste in R il numero x0 = supE. Affermiamo che f(x0) = 0. Infattise f(x0) < 0, evidentemente x0 < b. Inoltre per il teorema di permanenza delsegno in un intervallo a destra di x0 f sarebbe negativa. Ci sarebbero dunquepunti di E maggiori di x0, e questo non è possibile perché x0 è l’estremosuperiore di E.

Se f(x0) > 0, allora x0 > a e di nuovo per la permanenza del segno cisarebbe un intervallo sinistro (x0− δ, x0) di x0 in cui f sarebbe strettamentepositiva. I punti di E sarebbero allora tutti minori di x0 − δ, e dunquex0 ≤ x0−δ, assurdo. Non resta che f(x0) = 0, e il teorema è dimostrato.

Di questo, e di altri teoremi che vedremo, esiste una dimostrazione che fauso delle successioni.12 È istruttivo presentarne le idee. Si prende a1 = a eb1 = b. Poi si calcola f nel punto mediano, cioè

f

(a1 + b1

2

).

Se questo numero è negativo, si definisce a2 = a1+b12

, altrimenti si definisceb2 = a1+b1

2. Supponiamo, per fissare le idee, che a2 = a1+b1

2. Si divide in

due l’intervallo [a2, b1] e si calcola f(a2+b12

) Se troviamo un valore negativo,definiamo a3 = a2+b1

2, altrimenti definiamo b2 = a2+b1

2. Facendo sempre

lo stesso tipo di ragionamento, si costruiscono due successioni {an} e {bn},con la proprietà che f(an) < 0 e f(bn) > 0. Inoltre la prima successioneè monotona crescente, mentre la seconda è monotona decrescente. Infine,poich é ogni volta abbiamo dimezzato l’intervallo precedente, risulta

0 ≤ bn − an ≤b− a

2n. (5.7)

Le successioni monotone limitate13 hanno limite, siano

a∞ = limn→+∞

an, b∞ = limn→+∞

bn.

La relazione (5.7) dice che a∞ = b∞ e il teorema della permanenza de segnodice che f(a∞) ≤ 0, mentre f(b∞) ≥ 0. Poiché questi numeri coincidono,dev’essere f(a∞) = 0. Abbiamo pertanto individuato un punto di [a, b] dovef si annulla.

12Del teorema precedente esiste anche una dimostrazione molto elegante basata suargomenti topologici. Si veda [24].

13Ovviamente {an} e {bn} sono limitate, perché composte di punti dell’intervallo [a, b].

Page 85: lezioni di matematica

5.6. TEOREMI FONDAMENTALI PER LE FUNZIONI CONTINUE 77

Il metodo con cui abbiamo costruito a∞ = b∞ si chiama metodo di bise-zione, ed è uno dei primi metodi per il calcolo approssimato delle soluzionidi equazioni del tipo

f(x) = 0

con f funzione continua. Pur essendo indubbiamente efficace ed elegante,sono stati sviluppati metodi più veloci basati sul calcolo differenziale.14

Proponiamo un’interessante conseguenza del teorema degli zeri.

Teorema 5.33 (Valori intermedi). Una funzione continua definita su unintervallo [a, b] assume tutti i valori compresi fra f(a) e f(b).

Dim. Senza ledere la generalità del discorso, supponiamo f(a) ≤ f(b). Sce-gliamo y0 ∈ [f(a), f(b)] e dimostriamo che esiste x0 ∈ [a, b] tale che f(x0) =y0.

Se y0 = f(a), basta prendere x0 = a. Analogamente se y0 = f(b).Se f(a) < y0 < f(b), definiamo la funzione ausiliaria g(x) = f(x) − y0.Ovviamente g : [a, b] → R è continua, e g(a) = f(a)− y0 < 0, g(b) = f(b)−y0 > 0. Per il teorema degli zeri, esiste x0 ∈ [a, b] tale che g(x0) = 0. Maquesto vuole dire che f(x0) = y0. Il teorema è dimostrato.

Osservazione 5.34. Come si legge in [13], per molti decenni i matematicihanno ritenuto che la continuità fosse del tutto equivalente alla proprietàdei valori intermedi. Più precisamente, essi pensavano che se una funzionesoddisfa la proprietà dei valori intermedi in un certo intervallo [a, b], alloradeve essere continua in [a, b]. Oggi sappiamo bene che questo è falso, comedimostra la funzione

f(x) =

{sin 1

x, se x 6= 0

0, se x = 0.

È facile vedere che, preso arbitrariamente y ∈ [−1, 1], esiste almeno un nu-mero x ∈ R tale che sin 1

x= y. 15 Tuttavia f presenta una discontinuità in

x = 0.

14Non insistiamo sul fatto che questi metodi funzionano solo per le funzioni del calcolodifferenziale, mentre quelle continue sono indiscutibilmente più numerose. D’altra parte,molti problemi delle scienze applicate assumono tacitamente che tutte le quantità in giocosiano funzioni estremamente “addomesticate”.

15Ad esempio x = 1/ arcsin y per y 6= 0. Il caso y = 0 è altrettanto facile.

Page 86: lezioni di matematica

78 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

5.7 Massimi e minimiIn tutte le scienze, pure ed applicate, si pone un problema che possiamo for-mulare in questi termini: massimizzare (o minimizzare) una certa quantità,a sua volta dipendente da altre quantità.

Massimizzare il risparmio, minimizzare l’attrito, scegliere il percorso migliore per raggiungere un indirizzo: sono tutti esempi di ottimizzazione. Poi-ché il nostro corso ha carattere elementare, ci limiteremo ad alcune conside-razioni relative alle funzioni reali di una variabile reale. Avvertiamo però lostudente che si tratta solo del primo approccio ad una teoria molto ricca edifficile, che è oggetto di ricerca attiva.

Definizione 5.35. Sia f : A ⊂ R → R una funzione definita su un insiemeA. Diremo che x0 ∈ A è un punto di minimo assoluto per f se

f(x0) = infx∈A

f(x).

Analogamente diremo che x0 ∈ A è un punto di massimo assoluto per f se

f(x0) = supx∈A

f(x).

In parole povere, x0 è un punto di minimo assoluto se f(x0) ≤ f(x) perogni x ∈ A. Invece x0 è un punto di massimo assoluto se f(x0) ≥ f(x) perogni x ∈ A.

Ad esempio, se f(x) = x2 per ogni x ∈ R, è ovvio che 0 è un punto diminimo assoluto. Infatti, f(0) = 0 ≤ x2 = f(x) per ogni x ∈ R.

Avvertenza. Capita molto spesso di commettere delle piccole inesattezzeformali, parlando di massimi e minimi. Il più frequente è quello di dire “unminimo x0” invece di “un punto di minimo x0”. A rigor di logica, il minimo èil valore f(x0) della funzione nel punto di minimo. D’altra parte, una voltaindividuati i punti di massimo e minimo, è immediato calcolare il valore dellafunzione in tali punti. Questo spiega la tendenza a privilegiare la variabileindipendente rispetto a quella dipendente. Di solito, il contesto chiarisce dasé se si stia parlando di punti di minimo oppure di valori di minimo.

Consideriamo ora la funzione x 7→ (1 − x2)2 definita per ogni x reale.Essa è sempre maggiore o uguale a zero, e vale zero se e solo se x ∈ {−1, 1}.Quindi x = −1 e x = 1 sono gli unici due punti di minimo assoluti. Poichélimx→±∞(1− x2)2 = +∞, la funzione non è limitata dall’alto, e non esistonopunti di massimo assoluti. Però è intuitivo che la nostra funzione, nell’inter-vallo [−1, 1], deve avere dei valori maggiori di zero, e per simmetria rispettoall’asse delle ordinate in x = 0 c’è una “specie di massimo”.

Page 87: lezioni di matematica

5.7. MASSIMI E MINIMI 79

Definizione 5.36. Sia f : A ⊂ R → R una funzione definita su un insiemeA. Diremo che x0 ∈ A è un punto di minimo relativo per f se esiste unintorno U di x0 tale che

f(x0) ≤ f(x) per ogni x ∈ U ∩ A.

Diremo che x0 ∈ A è un punto di massimo relativo per f se esiste un intornoU di x0 tale che

f(x0) ≥ f(x) per ogni x ∈ U ∩ A.

Quando si parla di punti di minimo o massimo relativi, si guarda in real-tà la funzione solo “vicino” a tali punti, disinteressandosi completamente diquanto accade “lontano” da essi. Inutile sottolineare che un punto di minimo(o massimo) assoluto è anche un punto di minimo (o massimo) relativo. Nonè però vero il viceversa. Torneremo su queste considerazioni nel capitolo delladerivata.

Ma la ricerca dei punti di massimo e di minimo è basata solo su conside-razioni speciali, peculiari di volta in volta per la funzione in esame? Se cosìfosse, non esisterebbe nemmeno una teoria, ma solamente una raccolta di“trucchi”. Il teorema più famoso16 che fornisce una garanzia per l’esistenza dipunti di massimo e minimo (assoluti) è dovuto al grande matematico tedescoC. Weierstrass.17

Teorema 5.37 (Weierstrass). Sia f : [a, b] → R una funzione continua, de-finita su un intervallo chiuso e limitato. Allora f possiede almeno un puntodi minimo assoluto ed un punto di massimo assoluto.

Dim. Presentiamo una tipica dimostrazione che usa le successioni ottimiz-zanti. Diamo i dettagli per l’esistenza del massimo assoluto, lasciando leovvie modifiche allo studente per il caso del minimo. SiaM = supx∈[a,b] f(x).Se M = +∞, pe rle proprietà dell’estremo superiore, per ogni n ∈ N esistexn ∈ [a, b] tale che f(xn) > n, Dunque f(xn) → +∞ per n → +∞. SeM ∈ R, per ogni n ∈ N esiste xn ∈ [a, b] tale che

M − 1

n< f(xn) ≤M

e perciò f(xn)→M per n→ +∞. In ogni caso, esiste una successione {xn}di punti di [a, b] tale che limn→+∞ f(xn) = M .

16Talmente famoso da essere citato perfino in una pubblicità televisiva negli anni passati.17Una pronuncia accettabile è vaierstrass.

Page 88: lezioni di matematica

80 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Per il Teorema 3.28, la successione {xn} possiede una sottosuccessione{xnk} convergente ad un punto x1 ∈ [a, b]. Siccome f è continua, f(xn) →f(x0) per n→ +∞. Ma allora

M = limn→+∞

f(xn) = limk→+∞

f(xnk) = f(x1).

Abbiamo così dimostrato che f(x1) = M = supx∈[a,b] f(x). Ciò implica cheM ∈ R e che x1 è un punto di massimo assoluto per f .

Di questo importantissimo teorema vogliamo presentare una seconda di-mostrazione, basata sul metodo della bisezione. Seguiamo abbastanza fedel-mente [13].

Dimostrazione alternativa. Dimostriamo ad esempio che f ha massimo as-soluto. Detto S = supx∈[a,b] f(x), dividiamo l’intervallo I = [a, b] in dueintervalli uguali, e siano S1 e S2 gli estremi superiori di f in questi duesottointervalli. Poiché I è l’unione di questi sottointervalli, necessariamen-te S = max{S1, S2}. Abbiamo così individuato un intervallo I1 = [a1, b1]tale che supx∈[a1,b1] f(x) = S e b1 − a1 = (b − a)/2. Proseguendo allostesso modo, troveremmo degli int ervalli In = [an, bn] tali che In ⊂ In−1,bn − an = (b− a)/2n, e supx∈[an,bn] f(x) = S per ogni n ≥ 1. La successione{an} è monotona crescente, e la successione {bn} è monotona decrescente.Siccome entrambe sono limitate, necessariamente sono dotate di limite fini-to. Inoltre, limn→+∞ bn = limn→+∞ an + (b− a) limn→+∞ 2−n = limn→+∞ an.Detto x0 ∈ [a, b] il valore comune dei due limiti, vogliamo dimos trare chef(x0) = S. Si ha ovviamente f(x0) ≤ S. Se fosse f(x0) < S, posto2p = S − f(x0), si avrebbe f(x0) = S − 2p < S − p e dunque, per ilteorema della permanenza del segno, esisterebbe un intorno J di x0 tale chef(x) < S−p per ogni x ∈ J . D’altra parte le successioni {an} e {bn} tendonoa x0, e quindi per n abbastanza grande sia an che bn cadranno in J , e dunqueIn = [an, bn] ⊂ J . Ma allora si dovrebbe avere f(x) < S − p per ogni x ∈ In,il che è in contraddizione con il fatto che supx∈[an,bn] f(x) = S. Concludiamoche f(x0) = S, e per definizione ciò significa che x0 è un punto di massimoassoluto per la funzione f .

Osservazione 5.38. Per gli studenti più curiosi, segnaliamo che la secondadimostrazione è basata sulla forma del dominio di f , un intervallo chiuso elimitato. Il teorema di Weierstrass continua a valere per qualunque funzionecontinua definita su un insieme chiuso e limitato (ma non necessariamenteun intervallo). La dimostrazione alternativa non può essere estesa a questocaso più generale, mentre la prima dimostrazione resta essenzialmente valida.Per capirci, una funzione continua definita sull’insieme (chiuso e limitato)

Page 89: lezioni di matematica

5.7. MASSIMI E MINIMI 81

A = {0} ∪ {1/n | n ∈ N, n ≥ 1} possiede almeno un punto di massimo edun punto di minimo assoluti in A, ma non è chiaro come generalizzare l’ideadella bisezione all’insieme “stravagante” A. Osserviamo che A è costituitodai punti della successione {1/n}n≥1 e dal limite 0 di tale successione.

Più esplicitamente, questo teorema ci dice che, sotto le ipotesi fatte, esisteun punto x0 ∈ [a, b] di minimo assoluto per f , ed esiste un punto x1 ∈ [a, b]di massimo assoluto per f . Lo studente deve ricordare che il contenutodel Teorema di Weierstrass è tutto qui. Non si afferma nulla sul numerodi punti di massimo o minimo, né sulla loro localizzazione nell’intervallo[a, b]. Potrebbero coincidere con gli estremi, potrebbero essere dieci, centooppure mille. E, purtroppo, non dice come individuarli. In una giornatadi pioggia, saremmo tentati di sostenere che allora è un teorema inutile. Intal caso, faremmo bene ad attendere una giornata di sole per schiarirci leidee. Il teorema appena enunciato ci dice che, sotto le ipotesi scritte, i puntidi massimo e minimo assoluti esistono! Sarebbe una tortura dover cercarequalcosa che forse non esiste. Ci sarebbero studenti ormai decrepiti, ancoraimpegnati a controllare se una funzione ha massimi e minimi.18

Che le ipotesi del teorema di Weierstrass servano proprio tutte, si capiscedai prossimi esempi. Se il dominio della funzione non è un intervallo chiusoe limitato19 possono sorge problemi. Prendiamo la funzione f : x ∈ (0, 1] 7→1/x ∈ R. È continua sul suo dominio, ma non possiede massimo assoluto.Infatti supx∈(0,1] f(x) = +∞. Il dominio è un intervallo primo di uno degliestremi. Ma il teorema fallisce anche quando il dominio è un intervallo nonlimitato: f : x ∈ R 7→ ex ∈ R è una funzione continua, priva di massimoe di minimo assoluti. Infine, è evidente che la continuità sia fondamentale.Definiamo f : [−1, 1] 7→ R come

f(x) =

{|x|, x 6= 0

1, x = 0.

Questa funzione ha due punti di massimo assoluti negli estremi −1 e 1. Manon ha minimo assoluto. Infatti infx∈[−1,1] f(x) = 0 ma non esiste nessunx0 ∈ [−1, 1] tale che f(x0) = 0. È chiaro che f non è continua in x = 0.

18È un dato di fatto che questi studenti ci sono. Forse perché il perfido professore hachiesto di studiare una funzione che non verifica le ipotesi del teorema di Weierstrass. Lamatematica è interessante soprattutto quando obbliga a usare strumenti non ordinari.

19In realtà la formulazione generale del teorema di Weierstrass non si limita agliintervalli, ma non abbiamo le conoscenze per scendere nei particolari.

Page 90: lezioni di matematica

82 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

5.8 Punti di discontinuità

Definizione 5.39. Una funzione è discontinua in un punto appartenente alsuo dominio di definizione, se non è continua in quel punto.

Osservazione 5.40. La definizione precedente è opinabile. Ad esempio,tanti studenti sono fermamente convinti che la funzione x 7→ 1/(x−2) sia di-scontinua nel punto x = 2. In base alla nostra definizione, la stessa funzioneè continua in tutto il suo dominio di definizione. Chi ha ragione? In mate-matica la ragione sta sempre dalla parte di chi rispetta assiomi e definizioni.Quindi il problema si scarica sulla “giusta” definizione di punto di disconti-nuità. Quelli che pensano sia più corretto privilegiare l’idea di disegnare ungrafico senza staccare la penna dal foglio, diranno sicuramente che c’è unadiscontinuità in x = 2. Quelli che pensano le funzioni come oggetti dota-te inevitabilmente di un dominio di definizione, probabilmente penserannoche non ha senso parlare del comportamento di una funzione laddove non ènemmeno definita.

Poiché la libertà di pensiero è sacra, ma per andare avanti dobbiamo sce-gliere da che parte stare, d’ora in poi converremo che i punti di discontinuitàdebbano appartenere al dominio di definizione. Pertanto, la nostra funzionex 7→ 1/(x − 2) sarà considerata continua in tutti i punti del suo campo diesistenza.

Ma i punti di discontinuità sono tutti uguali? Riprendiamo l’enunciatodel Corollario 5.22. In un punto di discontinuità può capitare solo un numeromolto limitato di fenomeni. Ripetiamo, a costo di perdere la voce, che x0

deve appartenere al dominio di definizione di f .Un primo caso è quello dell’ultimo esempio della sezione precedente. La

nostra funzione “vorrebbe” essere continua, però noi le imponiamo di nonesserlo. Formalmente, ciò accade quando limx→x0 f(x) esiste finito, ma èdiverso da f(x0). Si usa parlare di discontinuità eliminabile in x0. Per quantodetto sopra, il punto x0 dovrebbe necessariamente appartenere al dominio didefinizione della funzione f . Tuttavia, proprio per il fatto che ci accingiamo adefinire opportunamente il valore f(x0), non è il caso di essere troppo rigidi.In pratica, se abbiamo una funzione fatta in modo che limx→x0 f(x) esistefinito, parliamo comunque di discontinuità eliminabile in x0, senza neanchecontrollare see x0 appartenga oppure non appartenga al dominio di f . Bastainfatti definire una nuova funzione

f(x) =

{f(x), x 6= x0

limx→x0 f(x), x = x0.

Page 91: lezioni di matematica

5.8. PUNTI DI DISCONTINUITÀ 83

Questa funzione coincide con f dappertutto, tranne in x0. Inoltre f ècontinua in x0, poiché f(x0) = limx→x0 f(x) = limx→x0 f(x).20

Un secondo caso è quello di una funzione in cui

limx→x0−

f(x) 6= limx→x0+

f(x),

pur essendo entrambi numeri reali. Il valore di f(x0) poco importa, non cisono speranze che f sia continua in x0. Intuitivamente, f “salta” dal valorelimx→x0− f(x) al valore limx→x0+ f(x). Si parla di discontinuità a salto in x0.

Infine, restano... tutti gli altri casi immaginabili. Ad esempio se almenouno dei due limiti destro e sinistro è infinito, oppure se il limite limx→x0 f(x)non esiste, oppure se uno solo dei limiti destro e sinistro non esiste. Parleremodi discontinuità di terza specie, senza addentrarci in ulteriori classificazioni.

20Uno studente spiritoso potrebbe sollevare la seguente obiezione: se è permesso cam-biare la funzione, qualunque funzione diventa continua. È un po’ provocatorio, ma haun fondo di verità: se iniziamo giocando a pallacanestro, non possiamo finire giocando abriscola.

Page 92: lezioni di matematica

84 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Page 93: lezioni di matematica

Capitolo 6

Il calcolo differenziale

Siamo arrivati al cuore del nostro corso: introdurremo finalmente lo strumen-to principale per analizzare il comportamento di una funzione. Molti studentiuniversitari conoscono già la derivata e le sue applicazioni. Li invitiamo anon commettere uno degli errori più spiacevoli, quello di vivere di renditasui ricordi liceali. Vedremo presto che a noi interessa esporre con rigore lateoria delle funzioni derivabili, mentre nelle scuole superiori c’è la compren-sibile tendenza a nascondere sotto il tappeto le difficoltà e le patologie. Nontutte le funzioni sono derivabili, anzi la famiglia delle funzioni derivabili èuna sparuta minoranza nell’universo delle funzioni continue.1

6.1 Variazioni infinitesime

Spiegare che cosa sia la derivata senza essere bourbakisti2 non è un compitofacile.

1Questa frase non è una sciocchezza. Esistono strumenti matematici che “misurano” lapercentuale di funzioni derivabili fra le funzioni continue. E il risultato, sorprendente sonoper chi si avvicina all’ Analisi Matematica per la prima volta, è che le funzioni derivabilisono davvero poche.

2 Dal nome di Nicholas Bourbaki. È il nome collettivo di un gruppo di matematicifrancesi che, nel XX secolo, decisero di rifondare la matematica moderna da un puntodi vista completamente deduttivo. Nei loro libri non si trovano spiegazioni discorsive, masolo definizioni seguite da teoremi e corollari. È un approccio affascinante alla matematica,ma considerato da molti pedagogicamente disastroso. Chi scrive ha sempre considerato ilibri pieni di grafici, figure e divagazioni varie piuttosto fuorvianti. Danno la sensazioneche tutto sia facile, mentre la realtà ben più dura. Se a molti basta avere una percezionedel proprio giardino, a molti altri farebbe comodo dare uno sguardo all’intera città. Leparabole sono funzioni continue, ma ci sembra più conveniente definire in astratto lacontinuità e poi applicarne i risultati alle parabole.

85

Page 94: lezioni di matematica

86 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

C’è chi ama parlare di rette tangenti, chi di velocità ed accelerazione. Pertutte queste motivazioni storico–filosofiche, rimandiamo lo studente ad unodei testi citati in bibliografia. In ogni caso, l’idea innovativa in comune èquella di variazione infinitesima di una funzione.

Ricordiamo che, data una funzione f : (a, b) → R, la variazione di f nelpunto x0 ∈ (a, b) di incremento h è il rapporto

∆f

∆x(x0, h) =

f(x0 + h)− f(x0)

h.

Questo rapporto è ben definito quando |h| è sufficientemente piccolo, in modoche x0 +h ∈ (a, b). Ha allora senso domandarsi che cosa rappresenti il limite

limh→0

∆f

∆x(x0, h) = lim

h→0

f(x0 + h)− f(x0)

h.

Spesso questo limite non esiste nemmeno; se consideriamo il punto x0 = 0 ela funzione f(x) = |x|, allora

limh→0−

f(x0 + h)− f(x0)

h= lim

h→0−

|h|h

= −1,

mentrelimh→0+

f(x0 + h)− f(x0)

h= lim

h→0+

|h|h

= 1,

Per altre funzioni, tale limite esiste banalmente. Prendiamo le funzionicostanti: f(x) = q per ogni x reale. Allora

limh→0

f(x0) + h)− f(x0)

h= lim

h→0

q − qh

= 0,

qualunque sia x0. Questo non ci soprende, dato che la variazione di una fun-zione costante non può che essere nulla, anche prima di prendere il limite perh→ 0. Se invece f(x) = mx+ q è una generica funzione lineare, calcoliamo

limh→0

f(x0) + h)− f(x0)

h= lim

h→0

[m(x0 + h) + q]− [mx0 + q]

h= m.

La variazione infinitesima di una funzione lineare coincide in ogni punto conil coefficiente angolare m. Anche per la parabola f(x) = x2 si fanno i calcoliagevolmente:

limh→0

f(x0) + h)− f(x0)

h= lim

h→0

(x0 + h)2 − x20

h

= limh→0

x20 + 2x0h+ h2 − x2

0

h= lim

h→02x0 + h = 2x0.

Page 95: lezioni di matematica

6.1. VARIAZIONI INFINITESIME 87

Per la funzione x 7→ x2, la variazione infinitesima dipende esplicitamente dalpunto x0 in ci la calcoliamo, e il risultato è 2x0.

Definizione 6.1. Sia f : (a, b) → R una funzione data, e sia x0 ∈ (a, b) unpunto di (a, b). Chiamiamo derivata di f in x0 il numero

Df(x0) = limh→0

f(x0 + h)− f(x0)

h, (6.1)

a patto che tale limite esista finito. Diremo che f è derivabile in x0 se esistela derivata Df(x0).

Altre notazioni di uso comune per la derivata sono

f ′(x0),df

dx(x0),

df

dx

∣∣∣∣x=x0

, f(x0)

La prima è forse la più diffusa e popolare, la seconda e la terza sono dovutea Leibniz, mentre la quarta è dovuta ad I. Newton. Quest’ultima è ancoraoggi la notazione preferita in Fisica e in Meccanica, dove la Seconda Leggedi Newton ha la forma

mx = F.

Avvertenza. La derivata è un’operazione che dipende dalla funzione f e dalpunto x0. In particolare, il nome della variabile indipendente non riveste al-cun ruolo. Ecco perché non amiamo particolarmente la notazione df

dx. Quella

x a denominatore ha un’evidenza che non le compete. Infatti, se usiamo unascrittura come f(t) = t2, dobbiamo scrivere df

dt. Il grande vantaggio della

notazione “frazionaria” dfdx

è che permette di scrivere formule come

d

dxsinx = cosx.

La notazioneD(x 7→ sinx)(x) = cos x,

per quanto logicamente più corretta, sembra improponibile. Lo studente èlibero di scegliere la notazione preferita, con la consapevolezza che

d

dtsinx = cos t

è una immane sciocchezza. L’importante è che, compiuta una scelta, ad essaci si attenga con coerenza.

Page 96: lezioni di matematica

88 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Prima di procedere, osserviamo che la derivata è anche caratterizzatadall’uguaglianza

Df(x0) = limx→x0

f(x)− f(x0)

x− x0

.

Infatti, basta cambiare variabile: x = x0 +h e osservare che x→ x0 se e solose h→ 0.

Proposizione 6.2. Ogni funzione derivabile in un punto è anche continuain quel punto.

Dim. Sia f derivabile in x0. Allora

limh→0

f(x0 + h)− f(x0) = limh→0

f(x0 + h)− f(x0)

h· h = Df(x0) · 0 = 0.

Quindi, ricordando l’osservazione che precede questa Proposizione, f(x0) =limx→x0

f(x), e la tesi è dimostrata.

Non soltanto esistono funzioni continue ma non derivabili in un singolopunto: Carl Weierstrass ha dimostrato il seguente, sorprendente, risultato.

Teorema 6.3 (Weierstrass). È possibile costruire una funzione, definita intutto R, che non è derivabile in alcun punto.

Il bello è che la dimostrazione è costruttiva, cioè si può scrivere unaformula che definisce tale funzione. Si tratta comunque di una definizioneun po’ particolare, che richiede la conoscenza delle serie di funzioni. Unadimostrazione alternativa è contenuta in [21, Theorem 1.2, pag. 192], marichiede un paio di pagine di calcoli!

Vediamo adesso che la derivata identifica in modo univoco una retta cherappresenta la migliore approssimazione lineare di ogni funzione derivabile.

Proposizione 6.4. Sia f : (a, b) → R una funzione, e sia x0 ∈ (a, b). Sonoequivalenti:

(i) f è derivabile in x0;

(ii) f è continua in x0, e la retta di equazione y = Df(x0)(x− x0) + f(x0)approssima la funzione f localmente, nel senso che

limx→x0

f(x)− (Df(x0)(x− x0) + f(x0))

x− x0

= 0.

Lasciamo la dimostrazione per esercizio. La retta y = Df(x0)(x− x0) +f(x0) si chiama retta tangente al grafico di f nel punto (x0, f(x0)).

Page 97: lezioni di matematica

6.2. IL CALCOLO DELLE DERIVATE 89

6.2 Il calcolo delle derivateQuando un esercizio chiede di calcolare la derivata della funzione f(x) =sin 5√

1 + log(x− 2), di sicuro nessuno studente di buon senso cercherà diapplicare la definizione di derivata. Esistono infatti alcune regole di deriva-zione, piuttosto facili da memorizzare, che ci aiutano a calcolare senza faticale derivate di funzioni anche molto complicate.

Teorema 6.5. Siano f e g due funzioni derivabili in un punto x0. Sia c unnumero reale. Allora le funzioni x 7→ f(x)+g(x), x 7→ f(x)g(x) e x 7→ cf(x)sono derivabili in x0, e valgono le identià

1. D(f + g)(x0) = Df(x0) +Dg(x0);

2. D(cf)(x0) = cDf(x0);

3. D(fg)(x0) = Df(x0)g(x0) + f(x0)Dg(x0) (regola di Leibniz).

Infine, se Dg(x0) 6= 0, allora anche la funzione x 7→ f(x)/g(x) è derivabilein x0, e vale l’identità

D

(f

g

)(x0) =

Df(x0)g(x0)− f(x0)Dg(x0)

(g(x0))2.

Dim. Le prime due formule sono facilissime da dimostrare, e lasciamo i det-tagli allo studente. La terza formula richiede il trucco di aggiungere e togliereuna quantità opportuna. Facciamo il limite del rapporto incrementale per lafunzione fg:

limx→x0

f(x)g(x)− f(x0)g(x0)

x− x0

= limx→x0

f(x)g(x)− f(x0)g(x) + f(x0)g(x)− f(x0)g(x0)

x− x0

= limx→x0

f(x)− f(x0)

x− x0

g(x)− g(x)− g(x0)

x− x0

f(x0)

= Df(x0)g(x0) + f(x0)Dg(x0).

La dimostrazione della formula per la derivata del quoziente potrebbe esserefatta in modo analogo. Invece, dimostriamola innanzitutto nel caso f(x) = 1per ogni x:

limx→x0

1g(x)− 1

g(x0)

x− x0

= limx→x0

g(x0)− g(x)

x− x0

1

g(x)g(x0)

= − Dg(x0)

(g(x0))2.

Page 98: lezioni di matematica

90 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Osservando che, per ogni x risulta

f(x)

g(x)= f(x)

1

g(x),

possiamo applicare la regola per la derivata del prodotto e l’ultima formula,ottenendo la derivata del quoziente.

Quindi, attenzione: la derivata della somma è la somma delle derivate,ma la derivata del prodotto è molto diversa dal prodotto delle derivate!

Un’altra regola di derivazione riguarda le funzioni composte.

Teorema 6.6 (Regola della catena). Siano f : (a, b)→ R, g : (c, d)→ R conf((a, b)) ⊂ (c, d).3 Se f è derivabile in x e se g è derivabile in f(x), allorag ◦ f è derivabile in x e vale la relazione

D(g ◦ f)(x) = Dg(f(x))Df(x).

Dim. La funzione v : (c, d)→ R data da

v(y) =

{g(y)−g(f(x))y−f(x)

, se y 6= f(x)

Dg(f(x)), se y = f(x)

è continua in f(x) perché g è per ipotesi derivabile in f(x). Inoltre per ognih sufficientemente piccolo si può scrivere

g(f(x+ h))− g(f(x))

h= v(f(x+ h))

f(x+ h)− f(x)

h

come si verifica subito distinguendo i due casi f(x+ h) 6= f(x) e f(x+ h) =f(x). Per h→ 0 si ha f(x+ h)→ f(x), v(f(x+ h))→ v(f(x)) = Dg(f(x))per il teorema di continuità delle funzioni composte. Quindi

limh→0

g(f(x+ h))− g(f(x))

h= Dg(f(x))Df(x),

e il teorema è dimostrato.

Osservazione 6.7. La precedente dimostrazione contiene in realtà una de-finizione equivalente di derivabilità per una funzione f , introdotta da Weier-strass. Una funzione f , definita almeno in un intorno del punto x0, è deriva-bile in x0 se e solo se esiste una funzione continua ω tale che

f(x) = f(x0) + ω(x)(x− x0), per ogni x.3Questa condizione garantisce che la funzione g ◦ f abbia senso.

Page 99: lezioni di matematica

6.2. IL CALCOLO DELLE DERIVATE 91

Infatti, la funzione continua ω è univocamente individuata dalla formula

ω(x) =

{f(x)−f(x0)

x−x0, x 6= x0

Df(x0), x = x0.

Leggendo fra le righe la dimostrazione del teorema precedente, lo studenteosserverà che la funzion v gioca esattamente il ruolo di ω per la funzione ginvece che per f .

Usando la notazione “frazionaria” per le derivate, ponendo

y = y(x), w = w(y),

la regola di derivazione delle funzioni composte prende la forma suggestiva

dw

dx=dw

dy

dy

dx.

Lo studente avrà notato che la dimostrazione dell’ultimo teorema non è affat-to scontata. Per spiegarne l’aspetto più delicato, introduciamo la notazione

∆f

∆x=f(x+ h)− f(x)

h

per il rapporto incrementale. Scriviamo per semplicità y = f(x). Ora, non èvero che

∆(g ◦ f)

∆x=

∆g

∆y

∆y

∆x.

Il punto è che potremmo aver diviso per zero, operazione vietata in mate-matica. Nessuno può garantire che ∆y = f(x + h) − f(x) 6= 0, a menodi supporre che Df(x) 6= 0. Tuttavia, sarebbe assolutamente pretestuosoaggiungere questa ipotesi nel teorema, che infatti vale comunque.4

Per applicare la regola della catena, occorre imparare ad isolare gli “atomi”che compongono una funzione. Tutte le funzioni di questo corso sono solosomme, prodotti, quozienti e composizioni delle solite funzioni elementari.Per esempio x 7→ sin(1 + x) si decompone nella composizione

x 7→ 1 + x 7→ sin(1 + x).

4D’accordo, lo studente è libero di credere che si commetterebbe un peccato veniale. Inmatematica, purtroppo, le dimostrazioni sono giuste o sbagliate. Spiace comunque notareche parecchi libri di testo, sia per le scuole superiori che per l’università, propongono unadimostrazione sbagliata della regola della catena.

Page 100: lezioni di matematica

92 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Quindid

dxsin(1 + x) = cos(1 + x) · 1,

poiché f(x) = 1 + x e g(y) = sin y. È molto utile ragionare come se fossimouna calcolatrice: ci viene fornito x, e su tale variabile facciamo delle ope-razioni. Nell’esempio, prima calcoliamo 1 + x, e poi calcoliamo il seno delrisultato. Ecco dunque le due funzioni che compongono x 7→ sin(1 +x). Nonc’è nulla di sbagliato in questo approccio, anche se presto si impara a rag-gruppare le operazioni più comuni. Se è vero che per la funzione x 7→ 3x+ 2si prende x, si trova 3x e p oi si trova 3x + 2, ben poche persone applicanola regola della catena a questa funzione. Più semplicemente, si nota che

d

dx(3x+ 2) =

d

dx(3x) +

d

dx2 = 3.

Il risultato deve essere lo stesso, ma l’esperienza aiuta sempre a sceglierequale strada prendere per giungere rapidamente al traguardo.

Esiste naturalmente una formula di derivazione della funzione inversa.Purtroppo, l’enunciato sembra più difficile di quanto non lo sia davvero.

Teorema 6.8 (Derivata della funzione inversa). Sia f : (a, b) → (c, d) unafunzione biunivoca e derivabile nel punto x0 ∈ (a, b). Allora la funzioneinversa f−1 : (c, d)→ (a, b) è derivabile nel punto y0 = f(x0) ∈ (c, d), e valela relazione

Df−1(y0) =1

Df(x0). (6.2)

Dim. La dimostrazione è diretta: siano y0 = f(x0) e k = f(x0 + h)− f(x0).Per la continuità della funzione inversa, k → 0 per h→ 0. Quindi

limk→0

f−1(y0 + k)− f−1(y0)

k= lim

h→0

h

f(x0 + h)− f(x0).

Ma questa è esattamente la relazione (6.2).

Illustriamo questo teorema con un esempio. Vogliamo calcolare la deri-vata della funzione logaritmo, definita da y ∈ (0,+∞) 7→ log y. È noto chequesta è la funzione inversa della funzione f : x ∈ R 7→ ex, nel senso chelog ex = x per ogni x ∈ R e elog y = y per ogni y > 0. Quindi stiamo calco-lando la derivata di f−1. Poiché Df(x0) = ex0 per ogni x0 reale, la regoladel precedente teorema ci garantisce che , se y0 = ex0 , allora

Df−1(y0) =1

ex0.

Page 101: lezioni di matematica

6.3. I TEOREMI FONDAMENTALI DEL CALCOLO DIFFERENZIALE93

Quindi

D log(y0) =1

ex0=

1

y0

,

e questo vale per ogni y0 > 0. Abbiamo quindi trovato la derivata del-la funzione logaritmo, senza nemmeno scriverne il rapporto incrementale.Seguendo questo schema, si calcolano le derivate delle funzioni inverse di se-no, coseno, tangente. Lo studente potrà ricavare le rispettive formule peresercizio, e troverà i dettagli nei testi citati in bibliografia.

6.3 I teoremi fondamentali del calcolo differen-ziale

Finora, l’introduzione della derivata non sembra questa gran rivoluzione. Sitratta di calcolare qualche limite di rapporti incrementali, usando di volta involta un’accorgimento particolare. Invece sono svariate le applicazioni dellederivate all’analisi delle funzioni, e in questo paragrafo ce ne occuperemodettagliatamente.

Per prima cosa, può essere utile definire le derivate sinistra e destra in unpunto.

Definizione 6.9. Sia f : (a, b)→ R una funzione continua, e sia x0 ∈ (a, b).Diciamo che f possiede derivata sinistra in x0 se esiste finito il limite

limh→0−

f(x0 + h)− f(x0)

h.

Analogamente, f possiede derivata destra in x0 se esiste finito il limite

limh→0+

f(x0 + h)− f(x0)

h.

Proposizione 6.10. Una funzione f : (a, b)→ R è derivabile nel punto x0 ∈(a, b) se e solo se f ha derivata destra e derivata sinistra in x0, e queste sonouguali fra loro.

Dim. È una conseguenza immediata della Proposizione 5.12.

Una prima applicazione di questo fatto è alle funzioni definite per “incol-lamento”.

Page 102: lezioni di matematica

94 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Teorema 6.11. Siano p : (a, b)→ R e q : (a, b)→ R due funzioni continue ederivabili. Sia x0 ∈ (a, b) un punto fissato. Definiamo la funzione f : (a, b)→R come

f(x) =

{p(x), x ∈ (a, x0)

q(x), x ∈ [x0, b).

Allora

1. f è continua in x0 se e solo se p(x0) = q(x0);

2. f è derivabile in x0 se e solo se p(x0) = q(x0) e Dp(x0) = Dq(x0).

La dimostrazione è evidente. Sottolineiamo che la sola condizioneDp(x0) = Dq(x0) non è sufficiente a garantire la derivabilit à di f . In-fatti le due funzioni p(x) = x e q(x) = x + 1 hanno la stessa derivata inx0 = 0, ma la funzione f costruita incollandole nell’origine ha un salto.

Esempio. Applichiamo questa “ricetta” alla funzione f(x) = |x|. In effetti,in base alla definizione del valore assoluto, possiamo scrivere

f(x) =

{x, (x ≥ 0)

−x, (x < 0)

e da ciò deduciamo che f non è derivabile in x0 = 0. Infatti l’incollamento ècontinuo in questo punto, ma la derivata di x differisce da quella di −x. Inogni altro punto x 6= 0, la derivata vale

f(x) =

{1, (x ≥ 0)

−1, (x < 0).

A volte si introduce la funzione segno sign: R \ {0} → R definita da signx =x|x| . Per esercizio, lo studente verifichi che f ′(x) = sign x per ogni x 6= 0.

Il prossimo teorema, dovuto al matematico francese Fermat,5 è di fonda-mentale importanza nella ricerca di massimi e minimi di una data funzione.

Teorema 6.12 (Fermat). Sia f : (a, b) → R una funzione, e sia x0 ∈ (a, b)un punto di massimo (o di minimo) relativo. Se f è derivabile in x0, alloraDf(x0) = 0.

5Si pronuncia fermà.

Page 103: lezioni di matematica

6.3. I TEOREMI FONDAMENTALI DEL CALCOLO DIFFERENZIALE95

Dim. Supponiamo che x0 sia un minimo relativo. Dunque, esiste un intorno[x0 − δ, x0 + δ] di x0 tale che f(x0) ≤ f(x) per ogni x di tale intorno. Siah ∈ (−δ, δ), e costruiamo il rapporto incrementale di f in x0:

f(x0 + h)− f(x0)

h.

Poiché x0 + h ∈ [x0 − δ, x0 + δ], il numeratore è sempre maggiore o uguale azero. Ne deduciamo che

Df(x0) = limh→0−

f(x0 + h)− f(x0)

h≤ 0,

mentreDf(x0) = lim

h→0+

f(x0 + h)− f(x0)

h≥ 0.

Se un numero è simultaneamente≤ 0 e≥ 0, allora tale numero è 0. Il teoremaè così dimostrato per i minimi relativi. Per i massimi relativi, si applicanole stesse considerazioni, e l’unica differenza è l’inversione delle ultime duedisuguaglianze.

Concretamente, il procedimento per individuare i punti di massimo eminimo relativi di una funzione assegnata è: isolo i punti dove f non èderivabile, e isolo gli (eventuali) estremi del dominio di definizione. Infinecerco gli zeri della derivata. Attenzione, il teorema di Fermat è falso se x0

cade in uno degli estremi di (a, b). Come esempio, sia f : x ∈ [0, 1] 7→ x. Ilminimo assoluto è in x = 0, il massimo assoluto in x = 1. Però f ′(x) 6= 0 perogni x ∈ [0, 1].

Definizione 6.13. I punti critici di una funzione derivabile f sono i puntix tali che Df(x) = 0.

Questa definizione non è superflua: non tutti gli zeri della derivata sonomassimi oppure minimi. Se poniamo f(x) = x3 per ogni x ∈ R, troviamofacilmente l’unico zero della derivata prima, x = 0. Ora, se x > 0 allorax3 = f(x) > 0, mentre se x < 0 è x3 = f(x) < 0. Quindi, l’origine non è unminimo né un massimo per f , visto che in ogni intorno dell’origine cadonopunto in cui f vale meno di 0 e punti in cui f vale più di 0. L’origine è dunqueun punto critico di f che non sa ppiamo ancora descrivere bene.6 Infine, lafunzione x 7→ |x| è un classico esempio di funzione con un punto di minimoassoluto (quale?) dove la derivata non esiste. Il prossimo teorema dà una

6Qualche studente ricorderà che 0 è un punto di flesso per f , ma ci arriveremo fra unpo’.

Page 104: lezioni di matematica

96 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

condizione sufficiente affinché una funzione derivabile abbia almeno un puntocritico. Invitiamo lo studente a convincersi con esempi che la condizione postanon è necessaria per l’esistenza di punti critici.7

Teorema 6.14 (Rolle). Sia f : [a, b]→ R una funzione continua e derivabilein (a, b). Se f(a) = f(b), allora esiste ξ ∈ (a, b) tale che 8 Df(ξ) = 0.

Dim. Per il teorema di Weierstraß la funzione f ha massimo e minimo (as-soluti) in [a, b]. Siano xM un punto di massimo e xm un punto di minimo.Esistono solo due casi:

1. sia xm che xM cadono agli estremi dell’intervallo [a, b]. Poiché f assume(per ipotesi) lo stesso valore in questi due punti, il massimo assolutodi f coincide con il minimo assoluto, e pertanto la funzione è costante.La sua derivata è dunque sempre uguale a zero, e non c’è altro dadimostrare.

2. Uno almeno dei due punti xm e xM cade all’interno dell’intervallo [a, b].Per il teorema di Fermat, in questo punto la derivata di f si annulla, ela dimostrazione è completa anche in questo caso.

In ogni caso, abbiamo verificato che la derivata di f si annulla in almeno unpunto di (a, b).

Osservazione. Il precedente teorema inaugura la serie di enunciati in cuisi tratta di funzioni continue su un intervallo chiuso [a, b] e derivabili nel-l’intervallo aperto (a, b). Non si tratta di un’inutile complicazione introdottada qualche docente particolarmente cattivo, bensì di un’effettiva necessità.L’esistenza delle derivate nei punti a e b non è necessaria. Anzi, la dimostra-zione del teorema di De l’Hospital richiede l’uso di questi teoremi esattamentecome li abbiamo enunciati.

Il Teorema di Fermat ci dice che i punti di massimo e di minimo si na-scondono fra i punti critici. Ma esiste un modo per stabilire se un puntocritico è un massimo, un minimo, o nessuno dei due? Ne esiste più di uno, eil modo più facile per capirlo è studiare la monotonia della funzione. Se essacresce a sinistra del punto critico, e decresce dopo averlo superato, siamoinequivocabilmente in presenza di un massimo relativo. Simmilmente peri minimi relativi. Ma come si studia la monotonia di una f unzione? Se lafunzione è derivabile, i metodi del calcolo differenziale ci sono utili. La chiaveè un teorema celeberrimo.

7Quello che vogliamo dire è: esistono funzioni dotate di punti critici, ma che nonsoddisfano l’ipotesi fondamentale del teorema di Rolle.

8La lettera greca ξ si legge più o meno “csi”.

Page 105: lezioni di matematica

6.3. I TEOREMI FONDAMENTALI DEL CALCOLO DIFFERENZIALE97

Teorema 6.15 (del valor medio, o di Lagrange). Sia f : [a, b] → R unafunzione continua e derivabile in (a, b). Allora esiste ξ ∈ (a, b) tale che

Df(ξ) =f(b)− f(a)

b− a.

Dim. La tecnica dimostrativa consiste nell’applicare il teorema di Rolle auna funzione ausiliaria che ne verifica le ipotesi. A tale scopo, definiamog : [a, b]→ R mediante la formula

g(x) = f(x)− f(a)− f(b)− f(a)

b− a(x− a).

In pratica, facciamo la differenza fra f e la retta che unisce gli estremi(a, f(a)) con (b, f(b)). È chiaro che g è continua in [a, b], derivabile in (a, b),e g(a) = g(b) = 0 Dunque g soddisfa le ipotesi del teorema di Rolle, sicchéesiste ξ ∈ [a, b] dove Dg(ξ) = 0. Le regole di derivazione affermano cheDg(x) = Df(x)− f(b)−f(a)

b−a , e la condizione Dg(ξ) = 0 si legge

Df(ξ) =f(b)− f(a)

b− a.

Questo completa la dimostrazione del teorema.

Osservazione 6.16. Applicando alla funzione f(x) = log x il teorema pre-cedente, si dimostra la relazione di Nepero

1

b<

log b− log a

b− a<

1

a

per ogni 0 < a < b. Lasciamo i dettagli (semplicissimi) allo studente.

È frequente trovare il teorema di Lagrange come caso particolare di unaltro teorema molto famoso, dovuto al matematico francese Louis Augu-stin Cauchy. Lo enunciamo e diamo solo uno spunto per completarne ladimostrazione.

Teorema 6.17 (Cauchy). Siano f e g due funzioni continue su [a, b] e de-rivabili in (a, b). Suppponiamo inoltre che Dg(x) 6= 0 per ogni x ∈ (a, b).Allora esiste ξ ∈ [a, b] tale che

f(b)− f(a)

g(b)− g(a)=Df(ξ)

Dg(ξ)

Page 106: lezioni di matematica

98 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Cenno della dimostrazione. Trovare un numero erale k tale che il teorema diRolle sia applicabile alla funzione ausiliaria h(x) = f(x)−kg(x). Osserviamoche l’ipotesi Dg(x) 6= 0 per ogni x ∈ (a, b) implica in particolare g(b)−g(a) 6=0. È una conseguenza del teorema di Rolle.

Il teorema di Lagrange appare dunque come un caso particolare (perg : x 7→ x) del teorema precedente. Il fatto che le applicazioni del teorema diLagrange siano molte più di quelle del teorema di Cauchy, ci ha indotti adattribuirgli un’evidenza maggiore.

Il prossimo risultato mostra che la derivata di una funzione (derivabile)non può avere salti.Teorema 6.18. Sia f : (a, b)→ R una funzione derivabile. Se Df(a) < λ <Df(b), allora esiste ξ ∈ (a, b) tale che Df(ξ) = λ.Dim. Definiamo una funzione ausiliaria g : x ∈ (a, b) 7→ f(x) − λx. Perogni x ∈ (a, b), è Dg(x) = Df(x) − λ. Inoltre Dg(a) < 0, Dg(b) > 0.Quindi g è decrescente in un intorno di a e crescente in un intorno di b. Inparticolare, esiste un punto di minimo ξ ∈ (a, b) per g. Per il teorema diFermat, Dg(ξ) = 0, cioè Df(ξ) = λ.

6.4 Punti singolariSappiamo che una funzione derivabile in un punto deve essere ivi continua.Rovesciando logicamente questa affermazione, nessuna funzione è derivabilein un punto di discontinuità. Quindi la discontinuità è la causa più “rozza”di perdita di derivabilità. D’altronde, abbiamo già imparato che la funzionex 7→ |x| è continua ovunque ma non è derivabile in 0.Definizione 6.19. I punti singolari di una funzione sono quelli in cui lafunzione è continua ma non derivabile.

Elenchiamo due tipi di punti singolari.1. I punti angolosi. Sono quelli in cui la derivata destra e la derivata

sinistra esistono, ma non coincidono. La funzione del valore assolutone è un esempio.

2. Le cuspidi. Sono quelli in cui almeno una fra la derivata destra e laderivata sinistra è infinita.9 Il punto 0 è una cuspide per la funzionex 7→

√|x|.

9Il linguaggio è comprensibile ma impreciso. Una derivata non può essere infinita, inbase alle nostre definizioni. Qui intendiamo piuttosto dire che una delle due derivate destrao sinistra non esiste proprio perché il corrispondente limite del rapporto incrementale èinfinito.

Page 107: lezioni di matematica

6.5. APPLICAZIONI ALLO STUDIO DELLE FUNZIONI 99

Nei vari testi consultati, esistono piccole differenze nella classificazione deipunti singolari. In particolare, molti libri chiamano cuspide solo un puntosingolare in cui sono infinite sia la derivata sinistra che quella destra. Poi,però, non attribuiscono alcun nome al punto singolare in cui solo una di taliderivate è infinita. Fortunatamente, non sembrano esserci divergenze sulladefinizione dei punti angolosi.

6.5 Applicazioni allo studio delle funzioni

Teorema 6.20. Sia f : (a, b)→ R una funzione derivabile.

1. Se f è monotona crescente (risp. decrescente) allora Df(x) ≥ 0 (risp.Df(x) ≤ 0) per ogni x ∈ (a, b).

2. Se Df(x) ≥ 0 (risp. Df(x) ≤ 0) per ogni x ∈ (a, b), allora f èmonotona crescente (risp. decrescente).

3. Se Df(x) > 0 (risp. Df(x) < 0) per ogni x ∈ (a, b), allora f èstrettamente crescente (risp. strettamente decrescente).

Dim. La prima affermazione discende dal teorema della permanenza del se-gno applicato al rapporto incrementale. Le altre affermazioni sono conse-guenza del teorema di Lagrange. Fissati arbitrariamente x1 < x2 in (a, b),esiste un punto ξ ∈ (x1, x2) tale che f(x2)− f(x1) = Df(ξ)(x2−x1). Quindiil segno di f(x2)− f(x1) è individuato dal segno di Df(ξ).

Iil teorema precedente fornisce una regola per decifrare la monotonia diuna funzione derivabile. Salvo qualche cautela sulla monotonia stretta, oc-corre identificare gli intervalli dove la derivata è positiva: in tali intervalli, lafunzione cresce. La funzione invece decresce negli intervalli dove la derivataè negativa.

Una seconda applicazione del teorema di Lagrange riguarda la derivabilitàstessa. Supponiamo che una certa funzione sia continua in (a, b) e derivabilein tutti i punti dell’intervallo eccettuato al più un punto x0. Come si fa adecidere se la funzione è derivabile anche in x0? Si può pensare di ricorrerealla definizione, scrivendo il rapporto incrementale centrato in x0 e facendotendere a zero l’incremento. Oppure si può usare il seguente criterio.

Proposizione 6.21. Sia f : (a, b) → R una funzione continua. Sia x0 ∈(a, b) un punto, e supponiamo che f sia derivabile in (a, x0) ∪ (x0, b). Seesiste finito λ = limx→x0 Df(x0), allora f è derivabile in x0 e Df(x0) = λ.

Page 108: lezioni di matematica

100 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Dim. Sia x ∈ (a, b), x 6= x0. Per il teorema di Lagrange, esiste ξ = ξ(x) taleche f(x)− f(x0) = Df(ξ)(x− x0). Ovviamente, siccome ξ ∈ (x0, x), si avràξ → x0 per x→ x0. L’ipotesi della Proposizione garantisce allora che

limx→x0

f(x)− f(x0)

x− x0

= limx→x0

Df(ξ) = λ.

Perciò f è derivabile in x0, e Df(x0) = λ.

Occorre però fare attenzione, perché il criterio della Proposizione prece-dente è sufficiente ma non necessario per l’esistenza della derivata in x0.10

Consideriamo infatti la funzione

f(x) =

{x2 sin(1/x) x 6= 0

0 x = 0.

Poiché

0 ≤ |f(x)| = x2

∣∣∣∣sin 1

x

∣∣∣∣ ≤ x2 → 0

per x→ 0, f è continua un x = 0. Inoltre

limx→0

f(x)− f(0)

x− 0= lim

x→0x sin

1

x= 0.

Dunque Df(0) = 0. Se x 6= 0, la derivata vale

Df(x) = 2x sin1

x− cos

1

x,

che non ha limite per x → 0. La Proposizione non è perciò applicabile,mentre la derivata di f in 0 esiste.11

Osservazione 6.22. Se riflettiamo un istante sull’enunciato della Proposi-zione, ci accorgiamo che la sua tesi va oltre la mera esistenza della derivata inx0. In realtà, le ipotesi ci permettono di concludere che la funzione derivataf ′ è continua in x0: limx→x0 f

′(x) = λ = f ′(x0). Nei controesempi appenadiscussi, è chiaro che la derivata risultava sempre discontinua in x0.

10In parole povere, se il criterio si applica allora la funzione è derivabile; se il criteriofallisce, non siamo autorizzati a trarre alcuna conclusione. Invito lo studente a fare moltaattenzione.

11L’accanimento con cui presentiamo controesempi non deve indurre lo studente a pen-sare che tutti i teoremi siano “deboli”. Piuttosto, vogliamo evidenziare l’ottimalità delleipotesi.

Page 109: lezioni di matematica

6.6. DERIVATE SUCCESSIVE 101

6.6 Derivate successiveSe una funzione f : (a, b)→ R è derivabile in (a, b), la funzione x ∈ (a, b) 7→Df(x) definisce una funzione reale di una variabile reale, che chiamiamonaturalmente funzione derivata di f .

Definizione 6.23. Diremo che la funzione f è derivabile due volte nel puntox0 ∈ (a, b) se la funzione derivata di f è derivabile a sua volta in x0. Laderivata seconda di f in x0 è denotata con uno dei simboli

D2f(x0), f ′′(x0),d2f

dx2(x0), f(x0).

Evidentemente, è possibile iterare il ragionamento precedente, e parlarecosì di derivata terza, quarta, ecc. In generale, per indicare la derivata n–esima si usano i simboli

Dnf(x0), f (n)(x0),dnf

dxn(x0).

Impareremo presto ad usare uno strumento, il polinomio di Taylor, in cui lederivate successive rivestono un ruolo di fondamentale importanza. Nel restodi questo paragrafo, ci concentreremo sulla derivata seconda, l’ultima ad ave-re qualche interpretazione geometrica degno di nota. Prima però dobbiamointrodurre una definizione.

Definizione 6.24. Sia f : (a, b)→ R una funzione. Si dice che f è convessain (a, b) se, per ogni x1, x2 ∈ (a, b) e per ogni λ ∈ [0, 1], risulta

f ((1− λ)x1 + λx2) ≤ (1− λ)f(x1) + λf(x2). (6.3)

Si dice invece che f è concava in (a, b) se la funzione −f , che agisce comex 7→ −f(x), è convessa.

Posto x = (1−λ)x1 +λx2, la disuguaglianza di convessità si può riscriverecome

f(x) ≤ f(x1) +f(x2)− f(x1)

x2 − x1

(x− x1), x ∈ [x1, x2].

Essa quindi equivale all’affermazione geometrica: per ogni x1, x2 con x1 < x2,il grafico di f in [x1, x2] sta al di sotto della corda per i punti (x1, f(x1)),(x2, f(x2)).

Immaginiamo che lo studente sia stato introdotto, seppure brevemen-te, alla convessità durante le scuole superiori. Quasi certamente gli saràstato insegnato un linguaggio un po’ diverso: invece di funzione convessa,

Page 110: lezioni di matematica

102 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Figura 6.1: Una tipica funzione convessa

Figura 6.2: Una tipica funzione concava

Page 111: lezioni di matematica

6.6. DERIVATE SUCCESSIVE 103

funzione che volge la concavità verso l’alto. Pur sentendoci in grado di af-fermare che “convessità” è l’unica denominazione in voga nella matematicacontemporanea, poco importano i nomi e gli aggettivi.

Osservazione. Come visto, per noi la definizione di funzione convessa èdi natura globale, e non daremo un significato a frasi quali “la funzione èconvessa in un punto”.

Un altro punto sul quale condividiamo le perplessità dello studente è l’ap-plicabilità della disuguaglianza di convessità. Se, per esempio, non è difficiledimostrare con tale definizione che la funzione x 7→ x2 è convessa in tut-to R, per funzioni più complicate risulta impossibile gestire elementarmentele disuguaglianze. Occorrono dunque dei criteri, cioè delle condizioni attead assicurare la convessità di una data funzione mediante test maneggevoli.Eccone uno.

Proposizione 6.25. Sia f : [a, b] → R una funzione derivabile. Sono equi-valenti:

(i) f è convessa.

(ii) La funzione x 7→ Df(x) è monotona crescente in (a, b).

(iii) Il grafico di f è sopra tutte le sue tangenti, cioè per ogni x, x0 ∈ [a, b]

f(x) ≥ f(x0) +Df(x0)(x− x0).

La caratterizzazione più utile è l’equivalenza di (i) e (ii). La convessitàdi una funzione derivabile equivale in tutto e per tutto alla monotonia dellasua derivata prima. Siccome sappiamo che la monotonia di una funzione siriflette nel segno della derivata della funzione, abbiamo il seguente criteriodi convessità per le funzioni derivabili due volte.

Proposizione 6.26. Sia f : (a, b) → R una funzione derivabile due volte.Sono equivalenti:

(i) f è convessa.

(ii) D2f(x) ≥ 0 per ogni x ∈ (a, b).

Definizione 6.27. Sia f : (a, b) → R una funzione. Diremo che x0 ∈ (a, b)è un punto di flesso per f se f è convessa in (a, x0) e concava in (x0, b), oviceversa.

Page 112: lezioni di matematica

104 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

In altre parole, in un punto di flesso la retta tangente al grafico di f , seesiste, attraversa tale grafico. Vogliamo invece sfatare un mito assai diffuso.Non tutti gli zeri della derivata seconda sono punti di flesso. Sia f : x 7→ x4.Si ha D2f(0) = 0, ma 0 è evidentemente un punto di minimo assoluto per f .Vale per ò il seguente teorema.

Teorema 6.28. Una funzione f derivabile due volte e dotata di un punto diflesso in x0, deve verificare D2f(x0) = 0.

Dim. Infatti, f deve essere convessa a sinistra di x0 e concava a destra di x0

(o viceversa). Pertanto la derivata prima di f cambia il senso di monotoniaattraversando il punto x0. Questo implica che x0 è un punto di massimo (odi minimo) per Df . Il teorema di Fermat garantisce allora che D(Df)(x0) =D2f(x0) = 0.

Osservazione 6.29. Non è facile trovare in letteratura una definizione de-finitiva di punto di flesso. Il motivo è che si tratta di un’idea tipica per lefunzioni di una variabile. Volendo generalizzare la convessità a funzioni di unnumero maggiore di variabili, ci si imbatte nel problema seguente: mentre unpunto spezza l’asse reale R in due parti, un punto nello spazio (per esempiotridimensionale, cioè quello in cui viviamo) non suddivide lo spazio stesso inparti disgiunte. Non sembra dunque ragionevole parlare di punti di flesso perfunzioni di due, tre o più variabili.

Concludiamo questa sezione con qualche altra proprietà delle funzioniconvesse.

Lemma 6.30 (Disuguaglianza di Jensen, caso discreto). Supponiamo che fsia una funzione convessa definita in un intervallo I. Allora

f(α1x1 + . . .+ αnxn) ≤ α1f(x1) + . . .+ αnf(xn)

per ogni n ∈ N, x1, . . . , xn ∈ I, α1, . . . , αn ≥ 0 con α1 + . . . αn = 1.

Corollario 6.31. Supponiamo che f sia una funzione convessa definita inun intervallo I. Allora

f

(α1x1 + . . .+ αnxn

α1 + . . . αn

)≤ α1f(x1) + . . .+ αnf(xn)

α1 + . . . αn,

per ogni x1, . . . , xn ∈ I, α1, . . . , αn > 0.

Corollario 6.32. Fissiamo arbitrariamente n ∈ N, ed n punti xi > 0, peri = 1, . . . , n. Siano poi αi ≥ 0, per i = 1, . . . n, n numeri reali non negativitali che α1 + . . .+ αn = 1. Allora

xα11 x

α22 · · ·xαnn ≤ α1x1 + . . .+ αnxn.

Page 113: lezioni di matematica

6.7. CLASSI DI REGOLARITÀ 105

Osservazione 6.33. Se scegliamo α1 = α2 = . . . = αn = 1/n nel prece-dente corollario, otteniamo la nota relazione fra la media algebrica e mediaaritmetica di n numeri reali positivi:

n√x1x2 · · ·xn ≤

x1 + . . .+ xnn

.

Definizione 6.34. Sia I un intervallo della retta reale, e sia f : I → R unafunzione. Diremo che f è Jensen–convessa se

f

(x+ y

2

)≤ f(x) + f(y)

2

per ogni x, y ∈ I.

Ovviamente, tutte le funzioni convesse son oanche Jensen–convesse. Ilviceversa è in generale falso, ma diventa vero limitatamente alle funzionicontinue.

Proposizione 6.35. Ogni funzione Jensen–convessa e continua in un inter-vallo I è convessa in I.

Dim. Si veda, ad esempio, [21, Proposition 6.3].

6.7 Classi di regolaritàPer abbreviare alcuni enunciati, conviene introdurre una terminologia pro-gressiva per la regolarità di una funzione. Vorremmo assegnare alla continuitàil grado di regolarità più basso, per poi passare alla derivabilità una, due,tre, o più volte.

Definizione 6.36. Sia f : (a, b) → R una funzione. Diremo che f è diclasse Ck(a, b), e scriveremo f ∈ Ck(a, b), se f possiede k derivate in ognipunto di (a, b), e se queste derivate sono tutte funzioni continue in (a, b).Per estensione, diremo che f è di classe C∞(a, b), se f possiede derivate diordine arbitrariamente alto in (a, b).

Convenzionalmente, una funzione di classe C0(a, b) è semplicemente unafunzione continua in (a, b). Una funzione di classe C1(a, b) è una funzioneche possiede una derivata continua in (a, b). Invitiamo lo studente a prestareattenzione alla richiesta di continuità per tutte le derivate coinvolte. Potreb-be infatti accadere che una funzione sia derivabile, ma che la derivata abbiauna discontinuità: in questo caso non possiamo attribuire la regolarità C1.

Per dare qualche esempio, tutti i polinomi sono di classe C∞(R), cosìcome la funzione esponenziale, il seno e il coseno. Nei fatti, praticamentetutte le funzioni elementari sono di classe C∞ nel loro dominio di definizione.

Page 114: lezioni di matematica

106 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

6.8 Grafici di funzioniAbbiamo ormai tutti gli strumenti per effettuare uno studio qualitativo delgrafico di una funzione. Sappiamo che, in buona sostanza, il segno delladerivata prima è un indicatore della monotonia, mentre il segno della derivataseconda descrive la convessità. Per avere un grafico rappresentativo di unafunzione, conviene mettere in risalto gli eventuali asintoti.

Nella sostanza, un asintoto è semplicemente una retta verso la quale ilgrafico di una funzione si avvicina indefinitamente. Piuttosto che affron-tare una difficile definizione unitaria di asintoto, preferiamo presentare tredefinizioni. Sebbene la terza possa inglobare la seconda con poco sforzo, èdidatticamente consigliabile tenerle separate.

Definizione 6.37. Sia f una funzione reale di variabile reale, definita alme-no su un intervallo (a, b). La retta di equazione x = a è un asintoto verticaledestro per f se limx→a+ f(x) = ±∞. Similmente, la retta x = b è un asintotoverticale sinistro se limx→b− f(x) = ±∞.

Nulla impedisce che una retta x = c sia simultaneamente un asintotoverticale sinistro e destro. Ovviamente, la funzione f deve essere definitaalmeno in un intorno di c, escluso al più {c}.

Definizione 6.38. Sia f una funzione definita almeno su un intervallo illi-mitato (a,+∞). La retta di equazione y = q è un asintoto orizzontale destrose limx→+∞ f(x) = q. Analogamente, se f è definita almeno su un inter-vallo illimitato (−∞, a), la retta y = q è un asintoto orizzontale sinistro selimx→−∞ f(x) = q.

Meno ovvia è la definizione di asintoto obliquo, e soprattutto è menoimmediato capire se una funzione ammetta asintoti obliqui.

Definizione 6.39. Sia f una funzione definita almeno su un intervallo il-limitato (a,+∞). La retta di equazione y = mx + q, m 6= 0, è un asintotoobliquo per x → +∞ se limx→+∞ |f(x) − (mx + q)| = 0. Analogamente,possiamo definire un asintoto obliquo per x→ −∞.

In primo luogo, osserviamo che una condizione necessaria affinché unafunzione f abbia un asintoto obliquo (diciamo per x→ +∞) è che

limx→+∞

f(x) = ±∞.

Questo è chiaro: se y = mx+ q è un asintoto obliquo, allora

limx→+∞

f(x) = limx→+∞

f(x)−mx− q +mx+ q = limx→+∞

mx+ q = ±∞.

Page 115: lezioni di matematica

6.8. GRAFICI DI FUNZIONI 107

Vediamo come calcolare i coefficienti m e q di un asintoto obliquo. Selimx→+∞ |f(x)− (mx+ q)| = 0, a maggior ragione

limx→+∞

x

(f(x)

x−m− q

x

)= 0.

Quindi la parentesi deve tendere a zero, e

m = limx→+∞

f(x)

x. (6.4)

Ora che abbiamo trovato il coefficiente angolare m, dalla definizione stessadi asintoto obliquo deduciamo

q = limx→+∞

f(x)−mx. (6.5)

Non c’è bisogno di dire che considerazioni del tutto analoghe devono esserefatte per gli asintoti obliqui per x → −∞. Evidenziamo poi che abbiamosempre supposto m 6= 0. Da un lato, il caso m = 0 corrisponde all’asintotoorizzontale. Dall’altro, se la relazione (6.4) fornisce m = 0, non è correttoaffermare che esiste un asintoto orizzontale. Ad esempio, la funzione x 7→

√x

non ha asintoti per x→ +∞, eppure m = 0.Da ultimo, una stessa funzione può presentare due asintoti obliqui distinti,

il primo per x → −∞ e il secondo per x → +∞. Dunque le formule (6.4)e (6.5) devono essere applicate sia per x → +∞ che per x → −∞, senzaalcuna possibilità di fare economia sui calcoli.12

Riassumendo, studiare l’andamento di una funzione è un esercizio chepossiamo suddividere in vari passi. In particolare, lo studente potrà seguirequesto schema.

• Identificare eventuali simmetrie, anche in senso lato, o periodicità dellafunzione, così come le zone in cui la funzione è continua, derivabile, ecc.

• Studiare l’andamento asintotico della funzione vicino ai punti estremidel dominio di definizione. Questo comprende anche il calcolo dei limitiall’infinito, e l’individuazione degli asintoti.

• Identificare il segno della derivata prima, cioè le zone in cui f è mo-notona, e i punti critici. Determinare la natura degli eventuali punticritici, e, quando possibile, studiare il segno della derivata seconda perdefinire le regioni di convessità e gli eventuali punti di flesso.

12Lo studente non prenda questa affermazione come un’accusa di scarsa volontà. In uncorso non specialistico come il nostro, buona parte degli esercizi consiste nel fare conti.Prafrasando Pasolini, “calcolare stanca”, ma è anche l’unico modo per verificare se lostudente sa usare le idee presentate a lezione.

Page 116: lezioni di matematica

108 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

• Studiare gli eventuali punti singolari.

• Disegnare il grafico cartesiano della funzione, avendo cura di dare risaltoalle conclusioni ottenute con l’analisi dei punti precedenti.

6.9 Il teorema di De l’HospitalLa collocazione di questo paragrafo può sembrare bizzarra, dal momento cheè consuetudine introdurre il Teorema di De l’Hospital subito dopo il teoremadel valor medio. Inoltre, averlo a disposizione prima di affrontare lo studio delgrafico di una funzione è di grande aiuto in determinate circostanze. Abbiamopreferito collocarlo in coda ai teoremi fondamentali del calcolo differenzialeper due ragioni: la prima è che questa scelta porta diritti a parlare delpolinomio di Taylor. La seconda è che tanto più un teorema è utile per gliesercizi, tanto più lo studente tende ad abusarne. Alcuni fra gli errori piùgrossolani negli elaborati d’esame riguardano esattamente questo teorema.Certo, il docente spesso contribuisce a seminare “trappole” negli esercizi; maanche questo è il suo lavoro.

Per ragioni pedagogiche, scindiamo l’enunciato in due teoremi piuttostosimili. Il primo enunciato copre la situazione [0/0], e il secondo la situazione[qualunque cosa/∞].13

Teorema 6.40 (Prima parte). Siano f : (a, b) → R e g : (a, b) → R duefunzioni derivabili. Supponiamo che

(i) limx→a+ f(x) = limx→a+ g(x) = 0;

(ii) Dg(x) 6= 0 per ogni x ∈ (a, b);

Selimx→a+

Df(x)

Dg(x)= L,

ammettendo anche la possibilità che L = ±∞, allora

limx→a+

f(x)

g(x)= L.

Dim. Sia q > L un numero arbitrariamente vicino a L, e scegliamo r ∈ Rtale che L < r < q. Per l’ipotesi sul limite del quoziente delle derivate, esistec ∈ (a, b) tale che

Df(x)

Dg(x)< r

13Questa simbologia è tratta da [10].

Page 117: lezioni di matematica

6.9. IL TEOREMA DI DE L’HOSPITAL 109

per ogni x ∈ (a, c). Ora, se a < x < y < c, il teorema di Cauchy implical’esistenza di un numero t ∈ (x, y) con

f(x)− f(y)

g(x)− g(y)=Df(t)

Dg(t)< r.

Facciamo tendere x→ a, e vediamo che

f(y)

g(y)< r

per ogni a < y < c. Similmente, se p < L è arbitrariamente vicino a L,poossiamo trovare un numero c tale che

p <f(y)

g(y)

per ogni a < y < c. Riassumendo, abbiamo dimostrato che il rapportof(y)/g(y) è vicino a piacere a L, a patto di prendere y abbastanza vicino aa. La dimostrazione del teorema è completa.

Teorema 6.41 (Seconda parte). Siano f : (a, b) → R e g : (a, b) → R duefunzioni derivabili. Supponiamo che

(i) limx→a+ g(x) = ±∞;

(ii) Dg(x) 6= 0 per ogni x ∈ (a, b);

Se

limx→a+

Df(x)

Dg(x)= L,

ammettendo anche la possibilità che L = ±∞, allora

limx→a+

f(x)

g(x)= L.

Dim. La dimostrazione è molto simile a quella della prima parte. Dobbiamoperò usare l’ipotesi g(x)→ ±∞ per x→ a+. Sia q > L un numero arbitra-riamente vicino a L, e scegliamo r ∈ R tale che L < r < q. Per l’ipotesi sullimite del quoziente delle derivate, esiste c ∈ (a, b) tale che

Df(x)

Dg(x)< r

Page 118: lezioni di matematica

110 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

per ogni x ∈ (a, c). Ora, se a < x < y < c, il teorema di Cauchy implical’esistenza di un numero t ∈ (x, y) con

f(x)− f(y)

g(x)− g(y)=Df(t)

Dg(t)< r. (6.6)

Per fissare le idee, supporremo d’ora in avanti che limx→a+ g(x) = +∞.Lasciamo allo studente le piccole modifiche necessarie a trattare il casolimx→a+ g(x) = −∞.

Tenendo y fissa nell’ultima equazione, scegliamo c1 ∈ (a, c) tale cheg(x) > g(y) per ogni x ∈ (a, c1). Questo è possibile, perch é g(x) diventainfinitamente grande al tendere di x verso a. Per la stessa ragione, possiamoanche supporre che g(x) > 0. Moltiplicando la (6.6) per la quantità positiva(g(x)− g(y))/g(x), troviamo

f(x)

g(x)< r − r g(y)

g(x)+f(y)

g(x)

per ogni x ∈ (a, c1). Facciamo tendere x → a+ e deduciamo che esiste c2

tale chef(x)

g(x)< q

per ogni x ∈ (a, c2). Un ragionamento analogo mostra che per ogni p < Lesiste c3 tale che la disuguaglianza

p <f(x)

g(x)

sia valida per ogni x ∈ (a, c3). Come nella prima parte, la dimostrazione ècompleta.

Qualche parola di commento. Per semplificare gli enunciati, abbiamopresentato un caso modello, il limite per x → a+. Si tratta di una sceltapiuttosto convenzionale, visto che i teoremi continuano a valere anche perx → x0 ∈ (a, b) e perfino per x → ±∞. È sottinteso che, per i limitiall’infinito, le due funzioni devono essere definite almeno su un intervallodella forma (a,+∞) o (−∞, a).

Le dimostrazione dei teoremi precedenti sono abbastanza tecniche, macrediamo che quella della prima parte sia piuttosto chiara. L’ipotesi sul limitedel quoziente delle derivate viene usato per mezzo del teorema di Cauchy. Ladimostrazione della seconda parte richiede qualche accorgimento tecnico sulsegno del denominatore.

Attiriamo l’attenzione dello studente su un fatto: il teorema tratta la for-ma [qualunque cosa/∞]. Potrebbe non trattarsi di una forma indeterminata,ciò che importa è che siano soddisfatte le ipotesi del teorema.

Page 119: lezioni di matematica

6.9. IL TEOREMA DI DE L’HOSPITAL 111

Osservazione 6.42. Il teorema di De l’Hospital permette di dimostrare unaparziale inversione della Proposizione 6.21. Come visto, non possiamo aspet-tarci che l’esistenza del limite della derivata prima sia equivalente all’esistenzadella derivata prima nel punto x0, ma possiamo comunque dire qualcosa inpiù.

Proposizione 6.43. Supponiamo che f : (a, b)→ R sia una funzione conti-nua, che x0 ∈ (a, b), e che f sia derivabile in (a, x0) ∪ (x0, b). Se

limx→x−0

f ′(x) = λ− 6= λ+ = limx→x+

0

f ′(x),

allora f non è derivabile in x0.

Dim. Applichiamo il teorema di De l’Hospital ai due intervalli (a, x0) e (x0, b).Per definizione di derivata, dobbiamo controllare l’esistenza del limite

limx→x0

f(x)− f(x0)

x− x0

.

Tutte le ipotesi del teorema di De l’Hospital sono soddisfatte, in particolare

limx→x−0

f ′(x)

1= λ−,

limx→x+

0

f ′(x)

1= λ+.

Quindi

limx→x−0

f(x)− f(x0)

x− x0

= limx→x−0

f ′(x)

1= λ−,

mentrelimx→x+

0

f(x)− f(x0)

x− x0

= limx→x+

0

f ′(x)

1= λ+.

Il rapporto incrementale non possiede limite per x → x0, e dunque f non èderivabile in x0.

In poche parole, l’unico caso in cui la Proposizione 6.21 non si inverte, èesattamente quello dei nostri controesempi, in cui f ′ non possiede limite perx→ x0.

Lo studente confronti anche la Proposizione VII.24 di [6].

Oltre alle consuete applicazioni al calcolo dei limiti, il teorema di De l’Ho-spital è il fondamento di una fra le più eleganti tecniche di approssimazionedelle funzioni. Ce ne occupiamo nel prossimo paragrafo.

Page 120: lezioni di matematica

112 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

6.10 Il polinomio di Taylor

È piuttosto ragionevole affermare, anche nell’era del calcolo automatizza-to, che fare dei conti con i polinomi è più semplice che farli con funzioniqualunque. Questa osservazione tanto ovvia ha permesso di gettare le basidel calcolo approssimato. In questo corso toccheremo superficialmente duemetodi di approssimazione, il primo locale, il secondo globale.

In questo paragrafo, studieremo la possibilità di approssimare una fun-zione molto regolare14 mediante polinomi opportuni. Ricordiamo che unpolinomio di grado n è per noi una funzione della fo rma

Pn(x) = a0 + a1x+ a2x2 + a3x

3 + · · ·+ an−1xn−1 + anx

n,

dove i numeri reali a0, . . . an sono i coefficienti di Pn. Introduciamo infine lacosiddetta notazione di Landau per i limiti.

Definizione 6.44. Siano f e g due funzioni definite almeno in un intornodi a ∈ R. Diremo che f = o(g) (si legge f è o piccolo di g) per x→ a se

limx→a

f(x)

g(x)= 0.

Osservazione 6.45. Dalla definizione segue che la notazione “o piccolo”indica in realtà un insieme di funzioni. Per essere precisi, data una funzioneg definita (almeno) in un intorno di un punto x0, abbiamo definito l’insieme

o(g) =

{f | lim

x→a

f(x)

g(x)= 0

},

dove abbiamo sottinteso che le funzioni f di questo insieme sono anch’essedefinite (almeno) in un intorno di x0. A rigor di logica, dovremmo scriveref ∈ o(g) per x → x0 invece di f = o(g). Alcuni testi, ad esempio quellodi Mureşan [21], seguono questo approccio più rigoroso ma meno consue-to. Questa notazione sarebbe più corretta, ma ha avuto storicamente minorfortuna. 15

14L’aggettivo “regolare” è spesso usato come abbreviazione per espressioni riguardantila derivabilità. Per noi, una funzione regolare è una funzione dotata di derivata prima,seconda, terza, ecc. Il numero esatto delle derivate non conta molto, e verrà specificatonegli enunciati dei teoremi.

15È un peccato, perché il simbolo di uguaglianza perde in questa situazione la proprietàsimmetrica: Se f = o(g), non è affatto vero che in generale g = o(f). Insomma, bisognausare il simbolo = con grandissima cautela.

Page 121: lezioni di matematica

6.10. IL POLINOMIO DI TAYLOR 113

Osservazione 6.46. Se c’è un “o piccolo”, ci dovrebbe essere anche un “Ogrande”, dirà qualche studente. È vero, e il simbolo di O grande si utilizzaper dire che una funzione è “controllata” da un’altra, sia dall’alto che dalbasso, nell’intorno di un punto. Precisamente, se f e g sono due funzionidefinite (almeno) in un intorno di x0, si scrive f = O(g) per x→ x0 quandosi vuole dire che esistono un intorno I di x0 ed una costante C > 0 tali che

1

C|g(x)| ≤ |f(x)| ≤ C|g(x)| per ogni x ∈ I.

In altre parole, f = O(g) significa che il rapporto |f(x)/g(x)| si mantienelimitato nelle vicinanze di x0. Nel caso particolare in cui g è una funzionecostante,16 la scrittura f = O(g) significa esattamente che nelle vicinanze delpunto x0 la funzione f resta limitata. Per capirci, questo esclude la presenzadi un asintoto verticale in x0. Non ci soffermiamo oltre su questo linguaggio,che non useremo mai nel resto del corso. Per approfondimenti, il lettorepotrà consultare il classico libro di Prodi [22].

Scegliendo nella Definizione 6.44 come g la funzione costante ed uguale a1, f = o(1) significa semplicemente che f(x)→ 0 per x→ a. Lo studente siconvinca che la definizione di derivata può essere riscritta

f(x) = f(x0) +Df(x0)(x− x0) + o(x− x0) per x→ x0

Definizione 6.47. Siano f e g due funzioni definite almeno in un intornodel punto x0. Diremo che g approssima f all’ordine n se f−g = o((x−x0)n)per x→ x0.

Esplicitamente, richiediamo che

limx→x0

f(x)− g(x)

(x− x0)n= 0.

Un caso noto e particolarmente significativo è l’approssimazione all’ordine1, chiamata anche approssimazione lineare. Ogni funzione derivabile in unpunto è approssimabile linearmente in tale punto, e la funzione che realiz-za l’approssimazione è la funzione lineare affine rappresentata dalla rettatangente nel punto.

D’altronde, senza ulteriori condizioni dobbiamo aspettarci una gran quan-tità di funzioni approssimanti. Per esempio, la funzione quadratica f : x 7→ x2

è approssimata linearmente in x0 = 0 da qualunque funzione g : x 7→ αxn,con α ∈ R e n ≥ 2. Infatti

limx→0

x2 − αxn

x= lim

x→0x− αxn−1 = 0.

16Qui non importa il valore di tale costante.

Page 122: lezioni di matematica

114 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Però abbiamo già imparato che la retta tangente è l’unica retta che approssi-ma linearmente una funzione derivabile in un dato punto. Poniamo dunqueil seguente problema: determinare, se esiste, un polinomio di grado n cheapprossima una funzione all’ordine n nell’intorno di un punto x0.

Procediamo per passi successivi, chiamando f la funzione da approssimaree supponendo x0 = 0. Il caso di x0 qualunque verr à discusso fra poco. Pern = 1 sappiamo già che l’unico polinomio cercato è

P1(x) = f(0) +Df(0)x.

Per n = 2, la cosa migliore è scrivere il generico polinomio di secondo grado

P2(x) = a0 + a1x+ a2x2

e imporre la condizione di approssimazione:

limx→0

f(x)− P2(x)

x2= 0.

Il denominatore tende a zero, il numeratore a f(0)− a0. Quindi è necessarioche a0 = f(0). Il limite si riscrive

limx→0

f(x)− f(0)− a1x− a2x2

x2= 0.

Possiamo applicare la regola di De l’Hospital, e ci riconduciamo al limite delquoziente delle derivate

limx→0

Df(x)− a1 − 2a2x

2x.

La speranza è che tale limite valga zero, e come prima è necessario cheDf(0) = a1. Applicando una seconda volta la regola di De l’Hospital, trovia-mo la condizione necessaria D2f(0) = 2a2. Se un polinomio approssimantec’è, l’unica possibilità è che

P2(x) = f(0) +Df(0)x+1

2D2f(0)x2.

Lasciamo allo studente la verifica banale che questo P2 è effettivamenteun’approssimazione di ordine 2 di f in x0 = 0. Con la notazione di Landau,

f(x) = f(0) +Df(0)x+1

2D2f(0)x2 + o(x2).

Page 123: lezioni di matematica

6.10. IL POLINOMIO DI TAYLOR 115

Se avessimo scelto un punto x0 anche diverso da zero, la conclusione sarebbestata analoga ma un po’ meno trasparente. Il “trucco” consiste nello scrivereil generico polinomio nella forma

P2(x) = a0 + a1(x− x0) + a2(x− x0)2.

I valori per i tre coefficienti a0, a1 e a2 sarebbero stati gli stessi. Applicandopiù volte l’argomento del teorema di De l’Hospital, si dimostra il seguenterisultato.

Teorema 6.48 (Taylor). Sia f : (a, b)→ R una funzione derivabile n volte,e sia x0 ∈ (a, b) un punto fissato. Allora esiste uno ed un solo polinomio Pndi grado (al più) n, che approssima f in x0 con ordine n. I coefficienti di Pnsono

a0 = f(x0), ak =1

k!Dkf(x0) per k ≥ 1,

e conseguentemente

Pn(x) = f(x0) +n∑k=1

1

k!Dkf(x0)(x− x0)k.

Notazione. Il simbolo∑

è quello della sommatoria. Dato un insieme finitodi numeri reali {p1, p2, . . . , pn}, scriviamo

n∑k=1

pk = p1 + p2 + · · ·+ pk.

Forse qualche lettore avrà sentito parlare della possibilità di sommare infinitinumeri reali, l’operazione alla base della teoria delle serie numeriche. Questoargomento esula dal programma del nostro corso. In ogni caso, il simbolo disommatoria

∑è solo un’abbreviazione comoda sommare una quantità finita

di numeri.

Il bello della matematica è che, a parole, tutto è semplice. Adesso cheabbiamo definito il polinomio di Taylor, calcolarlo è concettualmente unasciocchezza. Abbiamo infatti la “ricetta” che ci restituisce meccanicamentetutti i coefficienti. Basta saper calcolare le derivate. In alcuni casi, tali calcolisono davvero facilissimi. Ad esempio, il polinomio di Taylor di una funzionepolinomiale è evidentemente la funzione stessa. Non c’è neanche bisogno difare calcoli, dato che basta inserire Pn = f nella definizione del polinomio diapprossimazione.

Page 124: lezioni di matematica

116 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Calcoliamo i primi tre termini del polinomio di Taylor della funzione

f(x) =1

1− x− x2

con punto iniziale x0 = 0. Ci servono le prime due derivate di f :

Df(x) =1 + 2x

(1− x− x2)2

D2f(x) =2(1− x− x2)2 + 2(1 + 2x)2(1− x− x2)

(1− x− x2)4

Quindi

P2(x) = f(0) +Df(0)x+1

2D2f(0)x2 = 1 + x+ 2x2,

e perciò f(x) = 1 + x + 2x2 + o(x2) per x → 0. Osserviamo che l’approssi-mazione ottenuta vale solo per x in un intorno di x0 = 0, e lo studente deverifuggire la tentazione di estendere questa approssimazione a valori diversi dix.

Giunti fin qui, ci resta un dubbio: è possibile stimare l’errore compiutocon la sostituzione di Pn al posto di f? Abbiamo visto che tale errore devetendere a zero più velocemente di (x − x0)n, per x → x0. Ma di funzioniche tendono a zero è pieno il mondo. Sarebbe bello poter scrivere in terminipiù espliciti tale errore. Per il momento ci limitiamo al prossimo risultato.Quando avremo anche gli integrali definiti nella nostra cassetta degli attrezzi,potremo dare una stima d iversa e spesso più utile.

Teorema 6.49 (Formula di Taylor con resto di Lagrange). Supponiamo chef : [a, b]→ R. Sia n ∈ N e supponiamo che la derivata (n− 1)–esima Dn−1fsia una funzione continua in (a, b) e che Dnf(x) esista per ogni x ∈ (a, b).Siano x, x0 ∈ [a, b] due punti distinti, e sia Pn−1 il polinomio di Taylor di fcentrato nel punto x0 di ordine n− 1. Allora esiste un punto ξ compreso frax0 e x tale che

f(x) = Pn−1(x) +Dnf(ξ)

n!(x− x0)n.

Dim. Sia M quell’unico numero reale tale che f(x) = Pn−1(x) +M(x−x0)n.Definiamo la funzione g : (a, b)→ R come

g(t) = f(t)− Pn−1(t)−M(t− x0)n.

Vogliamo dimostrare che esiste ξ compreso fra x0 e x tale che n!M = Dnf(ξ).Derivando ripetutamente la funzione g, troviamo che

Dng(t) = Dnf(t)− n!M.

Page 125: lezioni di matematica

6.10. IL POLINOMIO DI TAYLOR 117

Ci basta allora dimostrare che Dng si annulla fra x0 e x. Poiché

DkPn−1(x0) = Dkf(x0)

per k = 0, . . . , n− 1, abbiamo

g(x0) = Dg(x0) = · · · = Dn−1g(x0) = 0.

La nostra scelta di M implica g(x) = 0, e applicando il teorema di Lagrangein [x0, x] deduciamo l’esistenza di x1 ∈ [x0, x] tale che Dg(x1) = 0. PoichéDg(x0) = 0 lo stesso teorema applicato in [x0, x1] garantisce l’esistenza dix2 in tale intervallo con Dg(x2) = 0. Dopo n passi, troviamo infine unpunto xn = ξ ∈ [x0, xn−1] tale che Dng(ξ) = 0. Poiché xn−1 è compreso percostruzione fra x0 e x, la dimostrazione è conclusa.

Un invito alla calma. Lo studente deve osservare con attenzione che laformula di approssimazione dell’ultimo teorema è

f(x) = Pn−1(x) +Dnf(ξ)

n!(x− x0)n.

C’è un’apparente sfasatura negli indici: infatti per il termine finale

Dnf(ξ)

n!(x− x0)n = o((x− x0)n−1).

Ma questo non è in contraddizione con la formula ricavata precedentemente.Per avere un’approssimazione lineare dobbiamo scegliere n = 2 nell’ultimoteorema. Non è il massimo della comodit à, ma da un punto di vista teoricoci sembra meglio privilegiare il ruolo della regolarità di f . Se la formula diTaylor con il resto “o piccolo” richiede n derivate per avere un’approssima-zione all’ordine n, la formula con il resto di Lagrange richiede n+ 1 derivate,per avere lo stesso ordine di appross imazione. Per avere l’approssimazionelineare con resto “o piccolo”, basta che la funzione sia derivabile. Se peròvogliamo la stima del resto del tipo

D2f(ξ)

2!(x− x0)2,

chiaramente f deve avere due derivate. Lo studente non farà fatica a ricono-scere come caso particolare del Teorema 6.49 proprio il teorema di Lagrange(n = 1).

Uno degli usi più frequenti delle formule di Taylor è il calcolo dei limiti.Supponiamo di voler calcolare il limite

limx→0

ex − 1− xx2

.

Page 126: lezioni di matematica

118 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

È una forma di indecisione evidente, e nessun limite notevole può risolverlasenza fare ulteriori indagini. Ma se ricordiamo la formula di Taylor per lafunzione esponenziale e la definizione di “o piccolo”, possiamo scrivere

ex − 1− xx2

=1 + x+ x2 + o(x2)− 1− x

x2= 1 +

o(x2)

x2→ 1

per x → 0. Una via alternativa17 consiste nell’applicare due volte la regoladi De l’Hospital. Lasciamo allo studente i dettagli relativi.

Qualche studente intraprendente potrebbe credere che i principali limitipossano essere dedotti dagli sviluppi di Taylor. Purtroppo, tali deduzionisarebbero quasi certamente scorrette da un punto di vista logico. Pensiamoal famoso limite

limx→0

sinx

x= 1. (6.7)

Se usiamo lo sviluppo di Taylor sinx = x− 13!x3 + o(x3), arriviamo immedia-

tamente al risultato. Ma calcolare il polinomio di Taylor richiede il calcolodelle derivate. Come si calcola la derivata della funzione seno in x = 0?Facendo il limite del rapporto incrementale:

limx→0

sinx− sin 0

x− 0= lim

x→0

sinx

x.

C’è qualcosa che non va: stiamo calcolando un limite notevole, ma abbia-mo bisogno di conoscerlo prima di calcolarlo. Questo apparente paradossodovrebbe farci riflettere sull’importanza di costruire una casa partendo dallefondamenta, e non dal primo piano. Dando per scontata la definizione “in-genua” delle funzioni goniometriche seno e coseno, prima dobbiamo calcolarei limiti notevoli, e solo poi possiamo calcolare le derivate. Quelle noiose di-suguaglianze geometriche che costituiscono la dimostrazion e elementare dellimite notevole (6.7) non sembrano facilmente evitabili.18

Infine, proponiamo un’applicazione della formula di Taylor al’analisi deipunti critici.

17Alternativa per modo di dire. Il polinomio di Taylor è sostanzialmente equivalenteall’uso di De l’Hospital, come visto. Se dovessimo calcolare ogni volta i coefficienti delpolinomio, tanto varrebbe usare De l’Hospital. Fortunatamente esistono le tabelle deglisviluppi di Taylor per le principali funzioni, e il loro uso riduce sensibilmente la moledi calcoli necessaria per calcolare molti limiti in forma indeterminata. Ovviamente, moltisoftware sono capaci di scrivere i polinomi di Taylor di funzioni arbitrarie in pochi secondi.

18I matematici puri danno spesso definizioni più raffinate per la funzione seno, e questopermette di calcolarne la derivata seguendo strade diverse. Purtroppo, nell’economia diun primo corso di matematica questi escamotages sono troppo complicati.

Page 127: lezioni di matematica

6.10. IL POLINOMIO DI TAYLOR 119

Proposizione 6.50. Sia f : (a, b) → R una funzione derivabile n volte in(a, b). Inoltre sia

Df(x0) = D2f(x0) = · · · = Dn−1f(x0) = 0, Dnf(x0) 6= 0.

Allora

1. se n è pari e Dnf(x0) > 0, x0 è un punto di minimo;

2. se n è pari e Dnf(x0) < 0, x0 è un punto di massimo;

3. se n è dispari, x0 non è né un punto di massimo né un punto di minimo.

Dim. Tutte le affermazioni discendono dal teorema di Taylor. Infatti, peripotesi si può scrivere

f(x) = f(x0) +Dnf(x0)

n!(x− x0)n + o((x− x0)n)

per x→ x0. Se n è pari, allora, in un intorno di x0, f(x)− f(x0) ha lo stessosegno di Dnf(x0), e si conclude. Se n è dispari, in ogni intorno di x0 ci sonopunti x in cui f(x)− f(x0) è positivo, e altri punti in cui la stessa quantitàè negativa. Pertanto, x0 non è né u massimo né un minimo relativo.

La proposizione precedente gode di una certa popolarità soprattutto neitesti di matematica per le scuole superiori. In effetti, quasi tutte le tecnichemeccaniche, che richiedono tanti calcoli e poco ragionamento, sembrano averegrande fortuna nell’insegnamento secondario.

Tuttavia, il calcolo delle derivate successive può essere fonte di banali er-rori di calcolo; conviene allora cercare di studiare il segno della derivata primaattorno a x0, per applicare il criterio di monotonia descritto in precedenza.

Fra l’altro, esistono funzioni “maleducate” alle quali la Proposizione di-mostrata adesso non si applica. Per esempio, la funzione P : R→ R definitada19

P (x) =

{exp(−1/x2), x 6= 0

0 x = 0

ha un evidente minimo in x = 0. Tuttavia si potrebbe dimostrare che perogni j ∈ N

DjP (0) = 0.

A parole, tutte le derivate di P calcolate in x = 0 sono nulle! Non c’e’ speran-za di descrivere la natura dell’origine mediante la Proposizione. Senza voler

19P è l’iniziale di “piatta”.

Page 128: lezioni di matematica

120 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

essere rigorosi, potremmo dire che P è “indefinitamente piatta” nell’origine.L’andamento qualitativo di P è evidenziato nella prossima figura.

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

–1 –0.8 –0.6 –0.4 –0.2 0.2 0.4 0.6 0.8 1

x

Page 129: lezioni di matematica

Capitolo 7

Teoria dell’integrazione secondoRiemann

Ogni studente universitario ha, o dovrebbe avere, una certa familiarità conil calcolo di aree e volumi. A livello elementare, diciamo fino alle scuolesuperiori, si impara a misurare perimetri, aree e volumi di speciali figure geo-metriche. Fra queste compaiono i quadrilateri, i triangoli, i parallelepipedi,e così via. Già la lunghezza della circonferenza pone diversi problemi tecni-ci, generalmente superati d’autorità insegnando che la circonferenza unitariamisura 2π.1 Sorvolando sulla definizione stessa di π, che spesso si dice valerecirca 3.14 senza altri particolari, la misurazione della lunghezza della cir-conferenza è resa attraente mediante il classico trucco dello spago arrotolatoattorno alla circonferenza.

Con le aree, la faccenda si fa ancora più spinosa. Infatti, se ci può sem-brare intelligente ed anche intuitivo dire che il rettangolo di lati a e b haun’area pari a ab (base × altezza), ben più inquietante è l’affermazione cheil cerchio di raggio r ha un’area pari a πr2 (raggio × raggio × 3.14). Quinon c’è più lo spago da arrotolare. Nei casi più fortunati, impariamo che lamisura dell’area del cerchio si ottiene inscrivendo in esso poligoni regolari conun numero sempre maggiore di lati, e facendo tendere all’infinito il numerodi lati. L’area del cerchio sarà allora il limite, per n → +∞, dell’area delpoligono regolare di n lati inscritto.

Ancora più in generale, consideriamo una funzione f : [a, b]→ R, positivae continua. Nel piano cartesiano, il suo grafico y = f(x) rappresenta unacurva continua: che significato potremmo dare all’area di piano che giacefra l’asse delle x e il grafico della funzione? Non è facile dare una risposta

1Ovviamente, occorrerebbe specificare un’unità di misura: metri, centimetri,chilometri.

121

Page 130: lezioni di matematica

122 CAPITOLO 7. INTEGRALE DI RIEMANN

completamente comprensibile da uno studente di terza media. Fu solo nelcorso del XVIII secolo che celebri matematici di nome Chauchy, Riemann,ecc. furono in grado di introdurre una teoria potente e compatibile conl’intuizione stessa di area.

Nelle sezioni seguenti presenteremo un approccio ormai classico all’inte-grazione secondo Riemann. Seguiamo da vicino [24] e l’appendice di [25].Non è d’altronde l’unico approccio possibile, e infatti in [6, 13] lo studentepuò trovare presentazioni diverse dalla nostra. In [5], la teoria dell’integralenon è veramente svolta, tranne per le funzioni continue.

Osservazione 7.1. Per molti decenni, i primi corsi di analisi matematicaper gli studenti di Scienze ed Ingegneria presentavano una teoria ristrettadell’integrazione, dovuta a L. A. Cauchy. Si introduce un integrale definitoche esiste in generale solo sotto l’ipotesi di continuità; quindi è uno strumentomeno potente di quello che vedremo nelle prossime pagine, sebbene abbia ilpregio della maggior semplicità.

Avvertenza. In queste note, abbiamo deciso di trattare la cosiddetta inte-grazione indefinita solo marginalmente in un paragrafo successivo. Riteniamoinfatti che la ricerca delle primitive sia una questione di esercizio, più che diteoria. Sul mio libro di quinta liceo scientifico,2 l’Autore scriveva che “tuttala teoria dell’integrale indefinito consiste di una definizione e di una decinadi integrali immediati”. La definizione è ovviamente quella di primitiva. Siusa dire che alla base di tale teoria stia la necessità di invertire l’operazionedi derivazione. Data una funzione, vorremmo scriverne (almeno) un’altra lacui derivata coincida con la funzione assegnata. Problema legittimo e al-quanto interessante, che si risolve comunque in una definizione, un paio diosservazioni e due regolette. Tutto il resto è esercizio. Ci piacerebbe chelo studente prendesse consapevolezza di un fatto: in matematica la teoriadell’integrazione è quella definita.

7.1 Partizioni del dominioSituazione: abbiamo una funzione f : [a, b]→ R, limitata, definita sull’inter-vallo chiuso e limitato [a, b].

Osservazione 7.2. L’ipotesi di limitatezza della funzione f sarà tacitamentemantenuta in tutto la trattazione dell’integrazione secondo Riemann. Nellasezione dedicata agli integrali impropri e generalizzati vedremo fino a che

2R. Ferrauto, Lezioni di Analisi Matematica. Casa editrice Dante Alighieri.

Page 131: lezioni di matematica

7.1. PARTIZIONI DEL DOMINIO 123

punto sia possibile parlare di integrazione definita per funzioni non limitate.Ovviamente, l’ipotesi di limitatezza potrebbe essere rimossa fin dall’iniziofacendo ricorso all’integrazione secondo Lebesgue.

Definizione 7.3. Una partizione di [a, b] è un insieme finito di punti P ={x0, x1, . . . , xn} tali che

a = x0 < x1 < x2 < · · · < xn−1 < xn = b.

Una partizione P ′ è più fine di P se contiene più punti di P . Date duepartizioni P e P ′, il loro raffinamento comune è la partizione P ? = P ∪ P ′.

Osservazione 7.4. Poiché le partizioni sono semplici insiemi, ad esse si ap-plicano tutte le consuete operazioni fra insiemi: unioni, intersezioni, ecc.Nei fatti, il raffinamento comune di due partizioni si ottiene mettendo in-sieme i punti di entrambe, e ovviamente disponendoli in ordine crescente digrandezza.

Definizione 7.5. L’ampiezza di una partizione P si definisce come

σ(P ) = maxi=1,...,n

|xi − xi−1|.

Notazione. Se P = {x0, x1, . . . , xn} è una partizione di [a, b], si pone

∆xi = xi − xi−1.

In corrispondenza di una partizione P , introduciamo due approssimazioni,l’una per difetto e l’altra per eccesso, dell’area sottesa dal grafico di f edall’asse delle ascisse. Per ogni i ∈ {0, 1, . . . , n}

mi = infxi−1≤x≤xi

f(x), Mi = supxi−1≤x≤xi

f(x). (7.1)

La limitatezza di f garantisce ovviamente che mi eMi sono numeri reali, cioè−∞ < mi ≤ Mi < +∞. È chiaro che questa conclusione diviene falsa senzaipotesi di limitatezza. Se, per esempio, f avesse un asintoto verticale x = x0

interno all’intervallo [a, b], almeno uno fra mi e Mi diventerebbe infinito perogni partizione contenente il punto x0.

Siano ora

L(P, f) =n∑i=1

mi∆xi, U(P, f) =n∑i=1

Mi∆xi.

Page 132: lezioni di matematica

124 CAPITOLO 7. INTEGRALE DI RIEMANN

Geometricamente, L(P, f) è la somma delle aree dei rettangoli di base ∆xi edi altezza mi, che rappresentano i rettangoli inscritti fra l’asse delle ascissee il grafico di f . Analogamente, i rettangoli di base ∆xi e altezza Mi sonocircoscritti al grafico di f . Intuitivamente, L(P, f) è un’approssimazione perdifetto dell’area sottesa dal grafico di f , mentre U(P, f) è un’approssimazioneper eccesso della stessa area.

Definizione 7.6. Il numero∫ b

a

f(x) dx = supPL(P, f)

prende il nome di integrale inferiore di f su [a, b]. Analogamente, il numero∫ b

a

f(x) dx = infPU(P, f)

prende il nome di integrale superiore di f esteso ad [a, b].

Segue dall’ovvia relazione L(P, f) ≤ U(P, f) che∫ baf(x) dx ≤

∫ baf(x) dx.

Inoltre, la limitatezza di f implica che i due integrali inferiore e superioresono sempre numeri reali finiti. Infatti, da m ≤ f(x) ≤M per ogni x ∈ [a, b]discende che

−∞ < m(b− a) ≤ L(P, f) ≤ U(P, f) ≤M(b− a) < +∞

per ogni partizione P . La conclusione segue prendendo l’inf e il sup al variaredelle partizioni P .

Definizione 7.7. Una funzione f : [a, b]→ R è integrabile secondo Riemannse∫ baf(x) dx =

∫ baf(x) dx. In questo caso il valore comune dei due integrali

inferiore e superiore prendo il nome di integrale definito di f , e si denota colsimbolo

∫ baf(x) dx.

Osservazione. In queste note, abbiamo privilegiato la notazione tipica deilibri di Calcolo

∫ baf(x) dx invece di quella, logicamente più coerente,

∫ baf .3

In effetti, dalle nostre definizioni consegue che solo f e l’intervallo [a, b] so-no coinvolti nella definizione di integrale. La variabile x è perfettamentesuperflua. Tuttavia, capita spesso di scrivere espressioni quali∫ 1

0

x2 dx =1

3.

3Capita di veder scritto∫ baf(x) dx, I(f, a, b), oppure

∫ badx f(x). Quest’ultima

notazione, a mio parere detestabile, è particolarmente popolare nei libri di fisica.

Page 133: lezioni di matematica

7.1. PARTIZIONI DEL DOMINIO 125

Un attimo di riflessione ci convince che quella appena scritta è un’inesattezzaparagonabile a

d

dxx3 = 3x2.

Sarebbe una battaglia persa convincere che la scrittura corretta è più o meno

d

dx(t 7→ t3)(x) = 3x2.

C’è stato qualche coraggioso che ha tentato di introdurre nell’Analisi mate-matica elementare queste notazioni, ma ormai nessuno ne ricorda il nome!

Morale della favola, i simboli∫ baf(x) dx e

∫ baf(y) dy rappresentano il

medesimo ente matematico.

Proposizione 7.8. Sia P una partizione, e sia P ′ più fine di P . AlloraL(P ′, f) ≥ L(P, f), e U(P ′, f) ≤ U(P, f).

Dim. Cominciamo a supporre che P ′ contenga esattamente un punto più diP . Se x è questo punto, esiste un indice i tale che xi−1 < x < xi, dove xi−1

e xi sono due punti consecutivi di P . Posto

w1 = infxi−1≤x≤x

f(x), w2 = infx≤x≤xi

f(x),

è chiaro che w1 ≥ mi e w2 ≥ mi. Quindi

L(P ′, f)− L(P, f) = w1(x− xi−1) + w2(xi − x)−mi(xi − x+ x− xi−1)

= (w1 −mi)(x− xi−1) + (w2 −mi)(xi − x) ≥ 0.

Un ragionamento del tutto analogo mostra che U(P ′, f) ≤ U(P, f). Se poiP ′ contiene un numero k > 1 di punti più di P , basta ripetere k volte ildiscorso appena visto.

La definizione di integrale appena introdotta non è molto significativa ri-spetto al calcolo effettivo degli integrali definiti. Inoltre, non abbiamo ancoracostruito una classe maneggevole di funzioni che possono essere integrate.Quest’affermazione non dovrebbe più sorprendere lo studente: sappiamo giàche solo alcune funzioni sono continue, altre sono derivabili. Certamente nonpossiamo aspettarci che “tutte” le funzioni siano integrabili.

Quella che segue è una caratterizzazione molto forte dell’integrabilit à.Essendo una condizione necessaria e sufficiente per l’integrabilità, sarà pos-sibile utilizzarla in maniera del tutto equivalente alla definizione di integra-bilità.

Page 134: lezioni di matematica

126 CAPITOLO 7. INTEGRALE DI RIEMANN

Teorema 7.9. Una funzione limitata f : [a, b]→ R è integrabile se e solo se,per ogni ε > 0 esiste una partizione Pε tale che

U(Pε, f)− L(Pε, f) < ε. (7.2)

Dim. Per ogni partizione P , è L(P, f) ≤∫ baf(x) dx ≤

∫ baf(x) dx ≤ U(P, f).

Se vale la (7.2), allora deduciamo che 0 ≤∫ baf(x) dx −

∫ baf(x) dx < ε, e

l’arbitrarietà di ε garantisce che∫ baf(x) dx =

∫ baf(x) dx. Questo significa che

f è integrabile.Viceversa, supponiamo che f sia integrabile. Fissato ε > 0, esistono due

partizioni Pq e P2 tali che

U(P2, f)−∫ b

a

f(x) dx <ε

2,

∫ b

a

f(x) dx− L(P1, f) <ε

2.

Se P ? è il raffinamento comune di P1 e P2, allora U(P ?, f)− L(P ?, f) < ε, epossiamo scegliere pertanto Pε = P ?.

La condizione (7.2) sarà quella che verificheremo sistematicamente percontrollare l’integrabilità delle funzioni. Prima di proseguire, vogliamo peròdare un’interpretazione più intuitiva dell’integrale di Riemann. Per quantone sappiamo finora, per calcolare l’integrale di una data funzione, dovremmocalcolare un estremo inferiore ed un estremo superiore al variare di tuttele possibili partizioni dell’intervallo [a, b]. Non è né comodo, né intuitivo.Vedremo fra un attimo che l’inte grale è in realtà un limite di aree di rettangolial tendere a zero della lunghezza delle basi dei rettangoli.

Definizione 7.10. Sia P = {x0, . . . , xn} una partizione di [a, b]. Una sommadi Riemann per la funzione limitata f su [a, b] è una somma del tipo

Σ(P, f) =n∑i=1

f(ti)∆xi,

dove ti ∈ [xi−1, xi] è un punto qualsiasi nell’intervallino [xi−1, xi].

Il teorema che segue permette di vedere l’integrale come un’operazione dilimite.

Teorema 7.11. Una funzione limitata f è integrabile se e solo se esiste finitolimσ(P )→0 Σ(P, f). In tal caso, risulta

∫ baf(x) dx = limσ(P )→0 Σ(P, f).

Page 135: lezioni di matematica

7.1. PARTIZIONI DEL DOMINIO 127

Dim. Supponiamo dapprima che A = limσ(P )→0 Σ(P, f) esista finito. Fissatoε > 0, esiste δ > 0 tale che σ(P ) < δ implica, per ogni scelta di t1, . . . , tn,

A− ε

2≤ Σ(P, f) ≤ A+

ε

2.

Sia P una partizione qualsiasi, con σ(P ) < δ. Facendo assumere a t1, . . . , tntutti i valori possibili e passando all’estremo inferiore e superiore delle corri-spondenti somme di Riemann, si ha

inft1,...,tn

Σ(P, f) = L(P, f),

supt1,...,tn

Σ(P, f) = U(P, f).

e quindiA− ε

2≤ L(P, f) ≤ U(P, f) ≤ A+

ε

4.

Ma allora f è integrabile, ed anzi A =∫ baf(x) dx per l’arbitrarietà di ε.

Viceversa, sia ε > 0 fissato. Esiste una partizione P ′ tale che U(P ′, f) ≤∫ baf(x) dx + ε

2. Supponiamo che P ′ sia costituita da n + 1 punti e quindi

divida [a, b] in n intervalli. Siano

M = supx∈[a,b]

|f(x)|, 0 < δ1 <ε

8Mn.

Consideriamo una partizione P tale che σ(P ) < δ1, e denotiamo con P ? ilraffinamento comune a P ′ e P . Allora

U(P, f) = U(P, f)− U(P ?, f) + U(P ?, f) ≤ U(P, f)− U(P ?, f) + U(P ′, f)

≤ U(P, f)− U(P ?, f) +ε

4+

∫ b

a

f(x) dx.

I punti di P ′ interni a intervalli di P sono al massimo n− 1, e quindi

U(P, f)− U(P ?, f) ≤ (n− 1) · 2Mδ1 <n− 1

n

ε

4<ε

4.

Quindi

U(P, f) ≤ ε

2+

∫ b

a

f(x) dx

per ogni partizione P con σ(P ) < δ. Analogamente si può provare che esisteδ2 > 0 tale che per ogni partizione P con σ(P ) < δ2 risulta

L(P, f) ≥∫ b

a

f(x) dx− ε

2.

Page 136: lezioni di matematica

128 CAPITOLO 7. INTEGRALE DI RIEMANN

Se σ(P ) < δ = min{δ1, δ2}, allora∫ b

a

f(x) dx− ε

2≤ L(P, f) ≤ U(P, f) ≤ ε

2+

∫ b

a

f(x) dx.

Poiché L(P, f) ≤ Σ(P, f) ≤ U(P, f), si ha∣∣∣∣Σ(P, f)−∫ b

a

f(x) dx

∣∣∣∣ ≤ ε

per ogni partizione P con σ(P ) < δ e per ogni scelta dei punti t1, . . . , tn. Perdefinizione, questo vuol dire che

∫ baf(x) dx = limσ(P )→0 Σ(P, f).

Osservazione 7.12. Molte attribuzioni vengono fatte per la teoria dell’in-tegrazione definita. L. A. Cauchy dimostrò che il limite delle somme diRiemann al tendere a zero dell’ampiezza della partizione esiste finito per tut-te le funzioni continue. Alcuni Autori chiamano pertanto integrale secondoCauchy quello costruito mediante il limite delle somme di Riemann applicatea funzioni continue. L’estensione al caso delle funzioni limitate sembra esseredovuta a Riemann, mentre l’approccio con gli integrali inferiore e superio-re è dovuto al matematico francese Darboux. Come vedremo, tutte queste“teorie” vengono a coincidere per la maggior parte delle funzioni elementarie addirittura per tutte le funzioni (limitate) che possiedono un numero finitodi punti di discontinuità nell’intervallo di integrazione [a, b].

Calcolo di un integrale mediante la definizione. Usando la teoriadelle serie numeriche e il Teorema precedente, mostriamo come calcolare unintegrale definito. Seguendo l’esempio di Archimede, calcoliamo l’area delsegmento parabolico:

S =

∫ 1

0

x2 dx.

Fissato arbitrariamente n ∈ N, consideriamo la partizione equi-distribuita

0 =0

n<

1

n<

2

n< . . . <

n− 1

n<n

n= 1.

Dando per scontato che la funzione x 7→ x2 sia integrabile in [0, 1], il Teoremaprecedente garantisce che la somma di Riemann

Sn =n∑k=1

(k − 1

n

)21

n

Page 137: lezioni di matematica

7.1. PARTIZIONI DEL DOMINIO 129

converge al valore S dell’integrale cercato per n → +∞. Per calcolare Sn,osserviamo che

Sn =1

n3

n∑k=1

(k − 1)2 =1

n3

(12 + 22 + 32 + . . .+ (n− 1)2

),

e dunque ci serve un’espressione chiusa per la somma dei quadrati dei primin − 1 numeri naturali. La formula per questa espressione è nota, ma non èmolto intuitiva. L’espressione chiusa è

Sn =1

n3

[1

3n3 − 1

2n2 +

1

6n

].

Per quanto detto sopra, ∫ 1

0

x2 dx = limn→+∞

Sn =1

3.

È piuttosto sorprendente che questo risultato, ottenuto praticamente con lostesso ragionamento esposto, fosse noto già nell’antica Grecia!

La verifica dell’integrabilità della funzione x 7→ x2 è contenuta nel pros-simo Teorema.

Una prima classe di funzioni certamente integrabili è quella delle funzionimonotone (crescenti oppure decrescenti).

Teorema 7.13. Sia f : [a, b]→ R una funzione monotona e limitata. Alloraf è integrabile.

Dim. Dimostriamo l’enunciato nel caso in cui f sia monotona crescente.Prendiamo ε > 0 arbitrariamente piccolo, e sia n un numero naturale mag-giore di (f(b)− f(a))(b− a)/ε. Consideriamo i punti equispaziati (nel sensoche ∆xi = xi − xi−1 = (b− a)/n per ogni valore dell’indice i)

xi = a+b− an

i, i = 0, . . . , n.

La partizione P = {xi}i=0,...,n verifica la condizione (7.2). Infatti, con ovviosignificato dei simboli,

U(P, f)− L(P, f) =n∑i=0

(Mi −mi)∆xi =n∑i=0

(f(xi+1)− f(xi))b− an

=b− an

n∑i=0

(f(xi+1)− f(xi)) =b− an

(f(b)− f(a)) < ε.

Page 138: lezioni di matematica

130 CAPITOLO 7. INTEGRALE DI RIEMANN

Dunque f è integrabile su [a, b]. Il caso in cui f sia decrescente è analogo.Di più, si deduce dal caso già dimostrato: infatti se f decresce, allora −fcresce. Poiché è evidente che una funzione f è integrabile se e solo se lo è−f , abbiamo concluso.

Osservazione. Il teorema precedente non dà informazioni di alcun tipo sulvalore di

∫ baf(x) dx. Ci dice soltanto che questo integrale di Riemann esiste.

Come sappiamo, una funzione monotona non è necessariamente una fun-zione continua. Si potrebbe dimostrare che non può essere “troppo” discon-tinua, ma questo va oltre gli scopi del nostro corso. Quindi, l’integrabilitàdelle funzioni continue non è un caso particolare del teorema sulle funzionimonotone. Purtroppo la dimostrazione che tutte le funzioni continue sonointegrabili richiede qualche fatica aggiuntiva.

7.2 La continuità uniforme e l’integrazione del-le funzioni continue

Ripensiamo alla definizione di continuità: una funzione f è continua nelpunto x0 se per ogni ε > 0 esiste δ > 0, dipendente da ε e da x0, tale che|x − x0| < δ implichi |f(x) − f(x0)| < ε. Pensiamo alla continuità dellafunzione x 7→ x2; si riesce a determinare esplicitamente un δ che soddisfaquesta condizione, ma non si può pretendere che lo stesso δ vada bene per ognix0.4 Decisamente diverso è il caso della funzione x 7→ x. Per questa funzione,basta scegliere δ = ε, senza specificare in quale punto x0 stiamo verificandola continuità. Questa proprietà è così importante che le si attribuisce unnome speciale.

Definizione 7.14. Una funzione f : D ⊂ R→ R è uniformemente continuain D se per ogni ε > 0 esiste δ > 0 tale che |f(x1) − f(x2)| < ε per ogniscelta di x1, x2 ∈ D tali che |x1 − x2| < δ.

La continuità uniforme è un concetto diverso dalla semplice continuità:la funzione exp: R→ (0,+∞), definita da expx = ex, non è uniformementecontinua in R. Infatti, negare la definizione di continuità uniforme significadimostrare che: esiste ε > 0 tale che, scelto arbitrariamente δ > 0, esistono

4Scriviamo un cenno della dimostrazione. Sia x0 6= 0, e fissiamo ε > 0. Se δ < ε/(2|x0|)e |x− x0| < δ, allora |x2 − x2

0| = |(x− x0)(x+ x0)| < δ · 2|x0| < ε. È evidente che δ → 0se |x0| → +∞. Questo rende impossibile la scelta di δ indipendentemente dal punto x0.

Page 139: lezioni di matematica

7.2. CONTINUITÀ UNIFORME 131

punti x1 e x2 ∈ D tali che |x1 − x2| < δ ma |f(x1) − f(x2)| ≥ ε. Ora, sescegliamo δ > 0 abbastanza piccolo, e se poniamo x1 = δ + 1/δ e x2 = 1/δ,ovviamente |x1 − x2| = δ e

| expx1 − expx2| = e1δ

∣∣eδ − 1∣∣ = δe

∣∣eδ − 1∣∣

δ→ +∞

per δ → 0+. Per questa ragione, la funzione continua exp non può essereuniformemente continua in R. L’ostacolo che si è frapposto fra la continuitàe la continuità uniforme è stato la possibilità di far tendere x1 e x2 all’infinitomentre δ → 0. Il prossimo risultato ci dice che tutte le funzioni continue suun intervallo chiuso e limitato sono addirittura uniformemente continue.

Teorema 7.15. Tutte le funzioni continue, definite su un intervallo chiusoe limitato della forma [a, b], sono uniformemente continue su tale intervallo.

Dim. Dimostreremo il teorema ragionando per assurdo. Se neghiamo la de-finizione di continuità uniforme, arriviamo all’enunciato: esiste ε? > 0 edesistono due successioni {xn} ed {yn} di punti in [a, b] tali che limn→+∞ |xn−yn| = 0 ma |f(xn) − f(yn)| ≥ ε?. Ora, per il Teorema 3.28, esistono duesottosuccessioni {xnk} di {xn} e {ynk} di {yn} tali che xnk → x∞ ∈ [a, b]e ynk → y∞ ∈ [a, b] per k → +∞, ma |f(xn) − f(yn)| ≥ ε?. L’ipotesi chelimn→+∞ |xn − yn| = 0 implica x∞ = y∞, e la continuità di f implica chef(xnk)→ f(x∞) e f(ynk)→ y∞ per k → +∞. Ma allora

0 < ε? ≤ limk→+∞

|f(xnk)− f(ynk)| = f(x∞)− f(y∞) = 0.

Questa catena assurda di disuguaglianze implica che era assurda la negazionedella continuità uniforme. Pertanto, f è uniformemente continua.

Osserviamo che la funzione x ∈ R 7→ x2 ∈ [0,+∞) non è uniformementecontinua, come si può verificare imitando il ragionamento utilizzato per lafunzione exp. Lo è invece ogni sua restrizione a intervalli chiusi e limitati.Per inciso, questo dovrebbe convincere lo studente che l’insieme di defini-zione di una funzione è tanto importante quanto la formula analitica che larappresenta.

Abbiamo ormai a nostra disposizione tutti gli ingredienti per formulare edimostrare un teorea di integrabilità per le funzioni continue su un intervallo.

Teorema 7.16. Una funzione continua f : [a, b]→ R è integrabile.

Page 140: lezioni di matematica

132 CAPITOLO 7. INTEGRALE DI RIEMANN

Dim. Per il teorema UC di uniforme continuità, la funzione f è uniforme-mente continua. Dato ε > 0, esiste δ > 0 tale che |f(x1)− f(x2)| < ε/(b− a)per ogni scelta di x1, x2 ∈ [a, b] tali che |x1 − x2| < δ. Sia P = {x0, . . . , xn}una partizione di ampiezza σ(P ) < δ. Allora

U(P, f)− L(P, f) =n∑i=1

(Mi −mi)∆xi

≤n∑i=0

ε

b− a(xi − xi−1) =

ε

b− a(b− a) = ε.

poiché |xi − xi−1| < δ e di conseguenza Mi −mi <εb−a . Abbiamo costruito

una partizione P che soddisfa la (7.2), dunque f è integrabile.

Più in generale, si dimostra il seguente risultato di integrabilità. Avvisia-mo lo studente che la dimostrazione è abbastanza complicata.

Teorema 7.17. Una funzione limitata f : [a, b] → R, avente un numerofinito di punti di discontinuità, è integrabile.

Dim. Fissato arbitrariamente ε > 0, poniamo M = maxx∈[a,b] |f(x)| e sia El’insieme (costituito da un numero finito di elementi) dove f è discontinua.Siccome E è un insieme finito, possiamo ricoprirlo con un numero finito diintervalli aperti [uj, vj] in modo che |vj−uj| < ε. Inoltre possiamo pensare diposizionare questi intervalli in modo che ogni elemento dell’insieme E∩ (a, b)sia contenuto in qualche (uj, vj). Rimuoviamo ora gli intervalli (uj, vj) da[a, b]. L ’insieme K che resta è chiuso e limitato. Quindi f è uniformementecontinua su K: esiste allora δ > 0 tale che |f(x) − f(y)| < ε se x, y ∈ K e|x− y| < δ. Costruiamo adesso una partizione P di [a, b] come segue:

1. ogni uj ed ogni vj appartengono a P ;

2. nessun punto di (uj, vj) appartiene a P ;

3. se xj non è uno dei punti uj, allora ∆xj < δ.

Osserviamo che Mi −mi ≤ 2M per ogni i, e che Mi −mi ≤ ε a meno chexi−1 non sia uno dei punti uj. Pertanto

U(P, f)− L(P, f) ≤ (b− a)ε+ 2Mε.

Dal momento che ε è arbitrario, abbiamo dimostrato l’integrabilit à di f .

Page 141: lezioni di matematica

7.2. CONTINUITÀ UNIFORME 133

Osservazione 7.18. Al di là dei tecnicismi, l’idea della dimostrazione puòessere riassunta così: si tolgono da [a, b] dei piccoli intorni di ogni punto didiscontinuità, e si osserva che le somme di Riemann si spezzano in due. Daun lato le somme dove f risulta continua e quindi integrabile. Dall’altra lesomme relative ai piccoli intorni appena costruiti.

Ricordando che somme, prodotti, quozienti di funzioni continue sono an-cora funzioni continue, alla luce del teorema di integrabilità per le funzionicontinue siamo spinti a credere che l’integrabilità rispetti le usuali operazio-ni aritmetiche. Questo è vero, ma naturalmente richiede una dimostrazioneindipendente dalla continuità. Ci limitiamo all’enunciato preciso.

Teorema 7.19. Siano f e g due funzioni limitate, definite sull’intervallo[a, b]. Se f e g sono integrabili, allora le funzioni f+g ed fg sono integrabili.Per ogni costante reale c, la funzione cf è integrabile. Se g(x) 6= 0 per ognix ∈ [a, b], allora anche f/g è integrabile. Valgono inoltre le formule∫ b

a

f(x) + g(x) dx =

∫ b

a

f(x) dx+

∫ b

a

g(x) dx,∫ b

a

cf(x) dx = c

∫ b

a

f(x) dx∣∣∣∣∫ b

a

f(x) dx

∣∣∣∣ ≤ ∫ b

a

|f(x)| dx.

Dobbiamo rifuggire dalla tentazione di estendere al prodotto fg e al quo-ziente f/g le formule di integrazione. Non è vero che l’integrale del prodottoè il prodotto degli integrali! Gli esempi si sprecano, e li vedremo quan-do sapremo come calcolare di fatto un integrale definito di una funzioneassegnata.

L’integrale di Riemann gode poi di una proprietà molto interessante:l’additività rispetto al dominio di integrazione.

Proposizione 7.20. Sia f : [a, b]→ R una funzione integrabile. Se c ∈ [a, b],allora f è integrabile su [a, c] e su [c, b], e risulta∫ b

a

f(x) dx =

∫ c

a

f(x) dx+

∫ b

c

f(x) dx.

L’ultima operazione inportante da analizzare è quella di composizione. Sipreserva l’integrabilità componendo funzioni integrabili? Sì e no: la funzione“esterna” deve essere almeno continua. Vale precisamente il seguente teorema.

Page 142: lezioni di matematica

134 CAPITOLO 7. INTEGRALE DI RIEMANN

Teorema 7.21. Sia f : [a, b]→ R una funzione integrabile su [a, b], e suppo-niamo che c ≤ f(x) ≤ d per ogni x ∈ [a, b]. Sia ϕ : [c, d] → R una funzionecontinua. Allora la funzione composta ϕ◦f : [a, b]→ R è integrabile su [a, b].

Deduciamo una conseguenza notevole: se f è positiva ed integrabile, an-che ogni potenza ad esponente reale positivo di f è ancora integrabile. An-che x 7→ ef(x) è integrabile. Lasciamo al lettore il piacere di costruirsi altricorollari dei risultati precedenti sull’integrabilità.

7.3 Il teorema fondamentale del calcolo inte-grale

Arriviamo così al momento più atteso da ogni studente: la “regoletta” percalcolare gli integrali. In altri termini, la formula che esprime il legame fral’integrale definito e le primitive di una funzione assegnata. Ci arriveremocon la dovuta calma, passando attraverso una formula “esplicita” per scriverele primitive di una funzione continua.

Teorema 7.22. Sia f : [a, b]→ R una funzione limitata e integrabile. Allorala funzione definita da

F (x) =

∫ x

a

f(t) dt, (a ≤ x ≤ b) (7.3)

è continua. Se f è continua nel punto x0 ∈ [a, b], allora F è derivabile in x0

e F ′(x0) = f(x0).

Dim. Sia M = supx∈[a,b] |f(x)|. Allora, presi x < y in [a, b], abbiamo che

|F (y)− F (x)| =∣∣∣∣∫ y

x

f(t) dt

∣∣∣∣ ≤ ∫ y

x

|f(t)| dt ≤M(y − x).

Quindi F è addirittura uniformemente continua. Supponiamo che f sia con-tinua in un certo x0. Fissiamo ε > 0 e sappiamo che esiste δ > 0 tale che|x− x0| < δ implica |f(x)− f(x0)| < ε. Allora, se |h| < δ,∣∣∣∣F (x0 + h)− F (x0)

h− f(x0)

∣∣∣∣ ≤ 1

h

∫ x0+h

x0

|f(t)− f(x0)| dt ≤ ε,

e questo dimostra che

F ′(x0) = limh→0

F (x0 + h)− F (x0)

h= f(x0).

La dimostrazione è conclusa.

Page 143: lezioni di matematica

7.3. TEOREMA FONDAMENTALE DEL CALCOLO 135

Abbiamo appena visto che tutte le funzioni continue su un intervallohanno una primitiva abbastanza esplicita, ottenibile mediante integrazionedefinita. Sottolineiamo che non si può prescindere dalla continuità di f .Infatti, prendiamo a = 0 e b = 2. La funzione discontinua

f(x) =

{0 se 0 ≤ x ≤ 1

1 se 1 < x ≤ 2

definisce la funzione integrale F (x) =∫ x

0f(t) dt mediante la formula

F (x) =

{0 se 0 ≤ x ≤ 1

x− 1 se 1 < x ≤ 2.

Questa funzione F è continua, ma non è una primitiva di f . Infatti, laderivata di F nel punto x = 1 non esiste, trattandosi di un punto angoloso.

Il risultato che segue, noto sotto il nome di Teorema di Torricelli– Barrow,contiene un primo legame fra integrazione definita e integrazione indefinita.

Teorema 7.23. Sia f : [a, b] → R una funzione continua. Se F è unaprimitiva di f , cioè F è derivabile in ogni punto e F ′ = f , allora∫ b

a

f(x) dx = F (b)− F (a).

Dim. Poniamo G(x) =∫ xaf(t) dt. Il teorema precedente ci mostra che G è

una primitiva di f , e pertanto

d

dx(F (x)−G(x)) = f(x)− f(x) = 0.

Quindi esiste un numero k reale tale che F (x)−G(x) = k per ogni x ∈ [a, b].Scegliendo x = a, vediamo che F (a)− 0 = k, cioè k = F (a). Quindi∫ b

a

f(x) dx = G(b) = F (b)− k = F (b)− F (a).

La dimostrazione è conclusa.

Questo enunciato è molto importante, e dipende in modo cruciale dallacontinuità della funzione integranda f . Tuttavia questa ipotesi non serve. Ilprezzo da pagare è quello di una dimostrazione più complicata.

Page 144: lezioni di matematica

136 CAPITOLO 7. INTEGRALE DI RIEMANN

Teorema 7.24. Sia f : [a, b] → R una funzione integrabile. Se F è unaprimitiva di f , cioè F è derivabile in ogni punto e F ′ = f , allora∫ b

a

f(x) dx = F (b)− F (a).

Dim. Sia ε > 0. Sappiamo che l’integrabilità di f implica l’esistenza diuna partizione P = {x0, . . . , xn} tale che U(P, f) − L(P, f) < ε. Per ognii = 1, . . . , n, il teorema di Lagrange applicato alla funzione F ci dice cheesiste ti ∈ [xi−1, xi] tale che F (xi) − F (xi−1) = f(ti)∆xi. Dal momento cheti ∈ [xi−1, xi], avremo mi ≤ f(ti) ≤Mi, e dunque∣∣∣∣∣

∫ b

a

f(x) dx−n∑i=1

f(ti)∆xi

∣∣∣∣∣ < ε.

Inoltre,

F (b)− F (a) = [F (x1)− F (x0)] + [F (x2)− F (x1)] + · · ·+ [F (xn)− F (xn−1)]

=n∑i=1

F (xi)− F (xi−1).

Deduciamo che∣∣∣∣F (b)− F (a)−∫ b

a

f(x) dx

∣∣∣∣ =

∣∣∣∣∣n∑i=1

F (xi)− F (xi−1)−∫ b

a

f(x) dx

∣∣∣∣∣=

∣∣∣∣∣n∑i=1

f(ti)∆xi −∫ b

a

f(x) dx

∣∣∣∣∣ < ε.

Questo conclude la dimostrazione.

Osservazione 7.25. Ci sembra utile proporre il seguente argomento per ladimostrazione del teorema precedente. Fissata arbitrariamente una parti-zione P di [a, b], per ogni indice i esiste un punto ti ∈ [xi−1, xi] tale cheF (xi)− F (xi−1) = f(ti)∆xi. Sommando rispetto a i, otteniamo

F (b)− F (a) =n∑i=1

F (xi)− F (xi−1) =n∑i=1

f(ti)∆xi, (?)

e a destra dell’ultimo segno di uguaglianza riconosciamo una somma di Rie-mann per la funzione f . Invocando allora il Teorema 6.8, ci sembrerebbe

Page 145: lezioni di matematica

7.3. TEOREMA FONDAMENTALE DEL CALCOLO 137

lecito far tendere a zero l’ampiezza σ(P ) della partizione P e di concludereche ∫ b

a

f(x) dx = limσ(P )→0

n∑i=1

f(ti)∆xi = F (b)− F (a).

La dimostrazione è così terminata. Ne siamo proprio sicuri? La risposta èche questa non è una dimostrazione corretta. Fare il limite delle somme diRiemann significa che per ogni ε > 0 esiste δ > 0 tale che, per ogni partizioneP di ampiezza σ(P ) < δ e per ogni scelta dei punti ti ∈ [xi−1, xi] si ha∣∣∣∣∣

n∑i=1

f(ti)∆xi −∫ b

a

f(x) dx

∣∣∣∣∣ < ε.

Invece, nel nostro ragionamento, i punti ti sono opportunamente scelti. Spo-standoli anche solo di poco, la relazione (?) diventa in generale falsa! Sipotrebbe dimostrare con poca fatica che le cose vanno a posto quando f ècontinua, dal momento che piccoli spostamenti dei punti ti comportano pic-coli spostamenti dei valori f(ti). Ma il teorema fondamentale del calcolo perle funzioni continue ha una dimostrazione ancora più elementare che abbiamogià proposto.

Ricapitolando, per calcolare un integrale definito basta procurarsi unaprimitiva e applicare il teorema di Torricelli.

Un’estensione pressoché immediata al concetto di primitiva è il seguente.

Definizione 7.26. Sia (a, b) un intervallo, e sia f : (a, b) → R. Si dice cheF : (a, b) → R è una primitiva in senso esteso di f se F è continua in ognipunto di (a, b), se F è derivabile in (a, b) eccetto al più un numero finito dipunti x1, . . . , xn, e se F ′(x) = f(x) per ogni x ∈ (a, b) \ {x1, . . . , xn}.

Invitiamo lo studente a dimostrare che se F e G sono due primitive insenso esteso di una certa f , allora F e G differiscono per una costante. Sug-gerimento: su ciascuno degli intervalli [x1, x2], [x2, x3], ecc. la funzione F−Gha derivata nulla. Quindi essa è costante su ognuno di questi intervalli. Ilpunto è che le varie costanti potrebbero essere diverse: F (x) − G(x) = C1

in [x1, x2], F (x) − G(x) = C2 in [x2, x3], e così via. La continuità di F e diG, assunta per ipotesi nella definizione precedente, obbliga tuttavia questecostanti a coincidere. La conclusione è ormai a portata di mano.

Page 146: lezioni di matematica

138 CAPITOLO 7. INTEGRALE DI RIEMANN

7.4 Media integrale

Se f : [a, b]→ R è integrabile, il numero

1

b− a

∫ b

a

f(x) dx

si chiama media integrale di f sull’intervallo [a, b]. Se P è una qualunquepartizione di [a, b], risulta

(b− a) infx∈[a,b]

f(x) ≤ L(P, f) ≤ U(P, f) ≤ (b− a) supx∈[a,b]

f(x),

e in particolare

infx∈[a,b]

f(x) ≤ 1

b− a

∫ b

a

f(x) dx ≤ supx∈[a,b]

f(x).

Questo mostra che la media integrale di f è un numero compreso fra l’estremoinferiore e l’estremo superiore di f . Se f è anche continua, sappiamo dalTeorema 5.33 che tale numero deve essere assunto in qualche punto di [a, b].Precisamente vale il seguente risultato.

Teorema 7.27. Se f : [a, b]→ R è continua, allora esiste ξ ∈ [a, b] tale chef(ξ) = 1

b−a

∫ baf(x) dx.

7.5 Applicazioni al calcolo degli integrali defi-niti

Ricordiamo che la formula di derivazione

(fg)′ = f ′g + fg′

conduce alla regola di integrazione per parti (si veda anche il paragrafosuccessivo) ∫

f(x)g′(x) dx = f(x)g(x)−∫f ′(x)g(x) dx.

Il teorema fondamentale del calcolo integrale ci dice immediatamente che∫ b

a

f(x)g′(x) dx = f(b)g(b)− f(a)g(a)−∫ b

a

f ′(x)g(x) dx.

Page 147: lezioni di matematica

7.5. APPLICAZIONI AL CALCOLO DEGLI INTEGRALI DEFINITI 139

Un po’ più complicata è la formula per calcolare correttamente gli integralidefiniti per sostituzione. Se x = g(t), t ∈ [c, d], è un cambiamento di variabilemonotono crescente,5 allora∫ b

a

f(x) dx =

∫ g−1(b)

g−1(a)

f(g(t))g′(t) dt. (7.4)

Se invece x = g(t), t ∈ [c, d], è un cambiamento di variabile monotonodecrescente, dobbiamo usare la formula∫ b

a

f(x) dx =

∫ g−1(a)

g−1(b)

f(g(t))g′(t) dt. (7.5)

Occorre fare molta attenzione alle formule (7.4) e (7.5). Queste ci diconoche integrando per sostituzione gli estremi di integrazione vanno cambiati.Vediamo un esempio: vogliamo calcolare∫ 2

1

log x

xdx.

Ponendo x = g(t) = et, la formula (7.4) afferma che∫ 2

1

log x

xdx =

∫ log 2

log 1

t

etet dt =

∫ log 2

0

t dt =1

2(log 2)2.

Invitiamo gil studenti a fare molto esercizio per memorizzare queste formule.Uno degli errori più diffusi è quello di dimenticarsi di cambiare gli estremi diintegrazione.

Osservazione 7.28. Dalla discussione appena fatta, discende che il calcolodi un integrale definito in cui sia necessario operare per sostituzione puòessere svolto in due modi:

1. lavorando sempre con l’integrale indefinito, e applicando il teoremafondamentale solo come ultimo passaggio;

2. lavorando direttamente sull’integrale definito, ricordando sempre dicambiare gli estremi di integrazione coerentemente con il cambiamentodi variabile.

5È sottinteso in questa espressione che g sia derivabile.

Page 148: lezioni di matematica

140 CAPITOLO 7. INTEGRALE DI RIEMANN

7.6 Cenni sulla ricerca delle primitiveL’insegnamento del paragrafo precedente è che occorre sviluppare una certamanualità nel calcolo delle primitive. Ricordiamo che

Definizione 7.29. Una funzione F è una primitiva di una funzione f sul-l’intervallo I se F è derivabile in I e risulta F ′(x) = f(x) per ogni x ∈I.

Osservazione 7.30. Se calcolare la derivata di una funzione la cui formulasi compone di funzioni elementari è sempre possibile mediante le regole dicalcolo dimostrate prima, il calcolo delle primitive delle funzioni elementaripu ò sconfinare dall’ambito delle funzioni elementari stesse. Per capirci, sipuò dimostrare che la funzione x 7→ ex

2 non possiede primitive esprimibilimediante formule elementari. Ovviamente questa funzione possiede primitivein quanto si trata di una funzione continua. Il punto è che non riusciremomai a scriverle esplicitamente mediante il solo utilizzo di funzioni elementari.

Innanzitutto, quante solo le primitive di una data funzione?

Proposizione 7.31. Dati un intervallo I ed una funzione f , due primitivedi f differiscono per una costante additiva.

Dim. Siano F1 ed F2 due primitive di f su I. Poiché

(F1 − F2)′ = F ′1 − F ′2 = f − f = 0 in I,

la funzione F1 − F2 è costante in I. Quindi esiste C ∈ R tale che F1(x) =F2(x) + C per ogni x ∈ I.

Quindi, se vogliamo trovare le primitive di una funzione su un intervallo,occorre e basta trovarne una: tutte le altre differiranno da essa per costantiadditive. Con un certo abuso di notazione, sottintendiamo l’intervallo I escriviamo ∫

f(x) dx = {F | F è una primitiva di f su I} . (7.6)

Questo perìo non ci aiuta nel calcolo effettivo delle primitive. Inoltre, ladefinizione non è operativa, a differenza di quella di derivata. Per affrontarequesto problema, cominciamo ad osservare che ogni tabella di derivate èautomaticamente una tabella di primitive. Ad esempio, dalla regola

d

dxsinx = cosx

Page 149: lezioni di matematica

7.6. CENNI SULLA RICERCA DELLE PRIMITIVE 141

deduciamo che una primitiva della funzione coseno è la funzione seno. Inoltre,le regole algebriche per il calcolo differenziale diventano (parzialmente) ergoleper il calcolo delle primitive. Infatti, se k è una costante reale,∫

(f(x) + g(x)) dx =

∫f(x) dx+

∫g(x) dx,∫

k · f(x) dx = k ·∫f(x) dx.

Non è ovviamente vero che la primitiva di un prodotto di funzioni sia il pro-dotto delle corrispondenti primitive! La formula di Leibniz per la derivazionedei prodotti dà origine alla regola di integrazione per parti.

Proposizione 7.32 (Integrazione per parti). Se f 4 g sono due funzioniderivabili in un intervallo I, allora∫

f(x)g′(x) dx = f(x)g(x)−∫f ′(x)g(x) dx. (7.7)

Dim. Dalla formula di Leibniz D(fg) = Df ·g+f ·Dg segue immediatamenteche

f(x)g(x) =

∫f ′(x)g(x) dx+

∫f(x)g′(x) dx,

cioè la formula della proposizione.

Vediamo come si applica, in pratica, questa formula. Supponiamo di volercalcolare

∫xex dx. Come scegliere f e g? Abbiamo due possibilit à:

1. f(x) = x e g′(x) = ex

2. f(x) = ex e g′(x) = x.

Nel primo caso, la Proposizione precedente dice che∫xex dx = xex −

∫ex dx = xex − ex + C.

Nel secondo caso, ∫xex dx =

x2

2ex −

∫x2

2ex dx.

È evidente che la seconda alternativa ha complicato il calcolo dell’integraleindefinito, mentre la prima l’ha risolto. Come “vedere” la scelta giusta?Non ci sono ricette universali, ed è soprattutto l’esperienza che permettedi scegliere la strada migliore senza perdersi in calcoli inutili e complicati.

Se fin qui abbiamo dato spazio alle regole algebriche, ci manca ancora unmetodo generale per affrontare la ricerca delle primitive di funzioni ottenutemediante composizione.

Page 150: lezioni di matematica

142 CAPITOLO 7. INTEGRALE DI RIEMANN

Proposizione 7.33 (Integrazione per sostituzione). Siano f ed x due fun-zioni derivabili e tali che la composizione f ◦ x abbia significato in un certointervallo. Allora ∫

f ′(x(t))x′(t) dt = f(x(t)) + C. (7.8)

Dim. Per la regola della catena,

d

dtf(x(t)) = f ′(x(t))x′(t),

sicché f(x(t)) + C =∫f ′(x(t))x′(t) dt.

Questa formula è molto meno trasparente di quella di integrazione perparti. In pratica, il metodo sembra potersi applicare solo alle funzioni in-tegrande di un tipo molto particolare, cioè (f ◦ x)x′. Vediamo ora S unesempio molto semplice di applicazione. Si voglia calcolare

∫ex+2 dx. Se po-

niamo f ′(x) = ex e t = x+ 2, allora x = x(t) = t− 2 è derivabile e l’integarleproposto si risolve con la formula di integrazione per sostituzione:∫

ex+2 dx =

∫f ′(x(t))x′(t) dt = et + C = ex+2 + C.

Ecco un secondo esempio: calcolare∫x sin(x2) dx. Poniamo x2 = t, in

modo che x = x(t) = ±√t. Quindi x′(t) = ± 1

2√te l’integrale diventa∫

±√t sin t

(± 1

2√t

)dt =

∫1

2

∫sin t dt = −1

2cos t+ C.

Torniamo infine alla variabile x, e poiché t = x2 possiamo scrivere∫x sin(x2) dx = −1

2cos(x2) + C.

Osservazione 7.34. Nell’ultimo esempio abbiamo cercato di proporre loschema pratico dell’integrazione per sostituzione, che appare un po’ diversodal contenuto della Proposizione 7.33. Per accertarsi di non aver commessoqualche ingenuo errore di calcolo, lo studente è senz’altro invitato a verificarela correttezza della propria soluzione facendo la derivata della (presunta) pri-mitiva. Se il risultato è esattamente la funzione da integrare, allora l’esercizioè corretto. Nel prossimo paragrafo lo studente può trovare una motivazioneun po’ formale del funzionamento del metodo di sostituzione.

Page 151: lezioni di matematica

7.7. IL DIFFERENZIALE 143

Osservazione 7.35. Capita spesso di leggere interi paragrafi di libri di testodedicati ai cosiddetti “integrali quasi immediati”. Si tratta di quegli integraliche si presentano sotto la forma generale∫

g(f(x))f ′(x) dx,

dove f e g sono due funzioni assegnate. In realtà, questi sono integralibanalmente calcolabili per sostituzione: infatti, ponendo t = t(x) = f(x),osserviamo che t′(x) = f ′(x), sicché∫

g(f(x))f ′(x) dx =

∫g(t) dt,

e basta allora procurarsi una primitiva G di g per concludere che∫g(f(x))f ′(x) dx = G(f(x)) + C.

Il secondo esempio visto sopra era in realtà di questo tipo: infatti∫x sin(x2) dx =

1

2

∫(2x) sin(x2) dx,

e riconosciamo un integrale “quasi immediato” nel quale f(x) = x2 e g(x) =sinx.

Se queste sono le uniche regole generali di calcolo delle primitive, que-sto non significa che siamo capaci di calcolare tutti gli integrali indefinitiche possiamo concepire. Anche escludendo quei casi che non possiedono pri-mitive esprimibili mediante funzioni elementari, il calcolo di una primitivapuò richieder l’uso ripetuto e/o sovrapposto delle regole studiate, oltre na-turalmente ad “astuzie” di natura algebrica o analitica. Insomma, il calcolointegrale mette alla prova lo spirito di osservazione dello studente, e costitui-sce certamente il primo ostacolo che la sola applicazione di regole meccanichenon permettono di aggirare.

Nel prossimo paragrafo ci occuperemo dell’integrazione indefinita di un’am-pia classe di funzioni, e saremo costretti ad utilizzare alcuni “trucchi” persemplificare il nostro lavoro.

7.7 Il differenzialeDefinizione 7.36. Una funzione lineare L : R→ R è una funzione tale cheper ogni x, y ∈ R ed ogni α, β reali risulti L(αx+ βy) = αL(x) + βL(y).

Page 152: lezioni di matematica

144 CAPITOLO 7. INTEGRALE DI RIEMANN

Osservazione 7.37. Non è difficile rendersi conto che tutte e sole le funzionilineari hanno la rappresentazione

L(x) = kx

per un valore opportuno di k ∈ R. In parole povere, le funzioni lineari di unavariabile sono rappresentate da rette uscenti dall’origine degli assi cartesiani.

Definizione 7.38. Una funzione f : (a, b) → R è differenziabile nel puntox0 ∈ (a, b) se esiste una funzione lineare L (dipendente ovviamente da x0)tale che

limh→0

f(x0 + h)− f(x0)− L(h)

h= 0. (7.9)

Il differenziale di f in x0, se esiste, viene indicato dal simbolo df(x0).

Osservazione 7.39. Dalla precedente osservazione, deriva che f è differen-zialbile in x0 se e solo se esiste un numero reale k tale che

limh→0

f(x0 + h)− f(x0)− khh

= 0,

e dunque se e solo se esiste un numero reale k tale che

k = limh→0

f(x0 + h)− f(x0)

h.

Dunque la differenziabilità in x0 coincide con la derivabilit à in x0! Di più,df(x0) altro non è che la funzione lineare h 7→ f ′(x0)h.

Perché abbiamo introdotto l’inutile concetto di differenziale se questocoincide (con leggero abuso di terminologia) con la derivata? Una rispostaraffinata ma poco corretta è che, per funzioni di due o più variabili, la derivatadeve essere definita mediante il differenziale per avere tutte le proprietà buoneche ci aspettiamo. Ma questa risposta non ci soddisfa, dato che per funzionidi una variabile reale abiamo visto che è tutto tempo sprecato.

Una risposta suggestiva è che il differenziale permette di rendere pi ùintuitiva la formula di itnegrazione per sostituzione. Infatti, se x = x(t) èla sostituzione che vogliamo effettuare nell’integrale, allora possiamo usare ilconcetto di differenziale per scrivere

dx = x′(t) dt,

pensando che dt sia un piccolo incremento (quello che prima abbiamo de-notato con h). Dunque, al posto di dx dobbiamo scrivere x′(t) dt, e questoporta direttamente alla formula di integrazione per sostituzione.

Page 153: lezioni di matematica

7.8. INTEGRAZIONE DELLE FUNZIONI RAZIONALI FRATTE 145

Osservazione 7.40. Capita spesso di leggere, sui testi più tradizionali dicalcolo differenziale, che i differenziali sono più flessibili delle derivate perché non richiedono che si specifichi da quali variabili dipendono le quantità inesame. Uno degli esempi classici è la legge della fisica pV = nT , dove pè la pressione, V il volume e T la temperatura (espressa in gradi Kelvin),menter n è una costante. A questo punto, si dice che “differenziando” questauguaglianza, si ottiene

p dV + V dp = n dT,

qualunque siano le variabili indipendenti da cui dipendono p, V e T . Perso-nalmente, non trovo questa conclusione così eccitante ed innovativa. Il puntoè che i matematici all’antica pensavano alle funzioni come a formule esplicitecontenenti una o pi ù variabili indipendenti. Se non potevano scriverle, sisentivano molto a disagio. Per noi, ormai, è chiaro che la derivata opera sul-le funzioni, indipendentemente dal nome scelto per le variabili indipendentiche la descrivono. Nonostante ciò, i fisici matematici continuano ad utiliz-zare un linguaggio pittoresco e simpaticamente vintage, e guai a mostrarsiindifferenti!

7.8 Integrazione delle funzioni razionali fratte

Le seguenti formule sono tratte da [2]: per a 6= 0,

∫dx

ax2 + bx+ c=

2√4ac− b2

arctan2ax+ b√4ac− b2

, b2 − 4ac < 0

1√b2 − 4ac

log

∣∣∣∣∣2ax+ b−√b2 − 4ac

2ax+ b+√b2 − 4ac

∣∣∣∣∣ , b2 − 4ac > 0

− 2

2ax+ b, b2 = 4ac.

La forma analitica delle primitive dipende essenzialmente dal segno di ∆ =b2−4ac. I calcoli seguenti dovrebbero risvegliare qualche ricordo nella mente

Page 154: lezioni di matematica

146 CAPITOLO 7. INTEGRALE DI RIEMANN

dello studente: per a 6= 0,

ax2 + bx+ c = a

(x2 +

b

ax+

c

a

)= a

((x+

b

2a

)2

+c

a− b2

4a2

)

= a

((x+

b

2a

)2

+4ac− b2

4a2

)

= a

((x+

b

2a

)2

− ∆

4a2

)

Vediamo che, per risolvere l’equazione algebrica di secondo grado

ax2 + bx+ c = 0

dobbiamo risolvere

a

((x+

b

2a

)2

− ∆

4a2

)= 0,

e cioè (x+

b

2a

)2

− ∆

4a2= 0.

Ma questa equazione è facile:

x+b

2a= ±

√∆

4a2= ±√

2a.

Lo studente non mancherà di notare che abbiamo ricavato la celeberrimaformula risolutiva per le equazioni (algebriche) di secondo grado:

x =−b±

√∆

2a.

La presenza della radice quadrata di ∆ ci costringe a distinguere tre casi:

1. ∆ > 0

2. ∆ < 0

3. ∆ = 0.

Cominciamo dall’ultimo caso. Il polinomio ax2 + bx + c possiede due radicireali coincidenti:

x1 = x2 = − b

2a.

Page 155: lezioni di matematica

7.8. INTEGRAZIONE DELLE FUNZIONI RAZIONALI FRATTE 147

Inoltre ax2 + bx+ c = a(x− x1)2. Quindi∫dx

ax2 + bx+ c=

1

a

∫dx

(x− x1)2= −1

a

1

x− x1

= − 2

2ax+ b.

Il caso ∆ > 0 si tratta come nel seguito. Il nostro polinomio di secondo gradopossiede le due radici reali distinte

x1 =−b−

√∆

2a, x2 =

−b+√

2a.

Perciò ax2 + bx+ c = a(x− x1)(x− x2), e∫dx

ax2 + bx+ c=

1

a

∫dx

(x− x1)(x− x2).

Cerchiamo due numeri reali A e B tali che

1

(x− x1)(x− x2)=

A

x− x1

+B

x− x2

per ogni x /∈ {x1, x2}. Mettendo a denominatore comune e operando qualchesemplificazione, otteniamo

1 = (A+B)x− Ax2 −Bx1

per ogni x /∈ {x1, x2}. Affiché questo sia vero, il coefficiente della x a secondomembro deve essere uguale al coefficiente della x a primo membro (cioè 0), ei termini noti devono coincidere. Pertanto occorre risolvere il sistema linearein due equazioni {

A+B = 0

Ax2 +Bx1 = −1.(7.10)

La soluzione si trova facilmente per sostituzione:{A = 1/(x1 − x2)

B = −1/(x1 − x2).

Dunque

1

(x− x1)(x− x2)=

1

x1 − x2

1

x− x1

− 1

x1 − x2

1

x− x2

.

Page 156: lezioni di matematica

148 CAPITOLO 7. INTEGRALE DI RIEMANN

Infine,∫dx

ax2 + bx+ c=

1

a

∫dx

(x− x1)(x− x2)

=1

a

(1

x1 − x2

log |x− x1| −1

x1 − x2

log |x− x2|)

=1

a(x1 − x2)log

∣∣∣∣x− x1

x− x2

∣∣∣∣ .Sostituendo i valori di x1 e x2 e facendo qualche calcolo algebrico, si arrivaalla formula scritta all’inizio di questo paragrafo.

L’ultimo caso è quello in cui ∆ < 0, ed è noto che il nostro polinomiodi secondo grado non possiede radici reali. Probabilmente alcuni studentisanno che esso possiede invece due radici complesse coniugate. Non avendodiscusso i numeri complessi, e visto che non ne trarremmo alcun vantaggioconcreto, evitiamo di insistere su tale terminologia. Per integrare la funzionerazionale ci basta osservare che

ax2 + bx+ c = a

(x2 +

b

ax+

c

a

)e che

x2 +b

ax+

c

a=

(x+

b

2a

)2

+c

a− b2

4a2.

Poiché ∆ < 0, esiste k ∈ R tale che

k2 =c

a− b2

4a2.

La sostituzione t = x+ b2a

ci conduce all’integrale

1

a

∫dt

t2 + k2=

1

ak2

∫dt

( tk)2 + 1

.

L’ulteriore sostituzione u = t/k risolve l’ultimo integrale:

1

ak2

∫dt

( tk)2 + 1

=1

ak2

∫k

u2 + 1du =

1

akarctanu+ C =

1

akarctan

t

k+ C.

Ricordando che t = x+ b2a

ed esplicitando il valore di k, si arriva dopo qualchepassaggio all’integrale voluto.

Sconsigliamo allo studente di imparare a memoria i risultati: lo sforzonon è banale, ed è certo più importante saper riprodurre i ragionamenti nelcaso concreto.

Page 157: lezioni di matematica

7.8. INTEGRAZIONE DELLE FUNZIONI RAZIONALI FRATTE 149

Osservazione 7.41. Come sempre, non esiste necessariamente un unicomodo di esprimere una primitiva. Si consideri l’esempio∫

dx

1− x2.

Si tratta evidentemente di una integranda di tipo razionale fratto. Ovvia-mente 1− x2 = (1− x)(1 + x), e dunque

1

1− x2=

1

2

1

1− x− 1

2

1

1 + x

e l’integrale diventa immediato:∫dx

1− x2=

1

2log |1− x| − 1

2log |1 + x|+ C.

Molti software di calcolo simbolico propongono una primitiva molto diversa:∫dx

1− x2= arctanhx+ C.

Ricordiamo che

sinhx =ex − e−x

2

coshx =ex + e−x

2

tanhx =sinhx

coshx.

Si verifica facilmente che6

(coshx)2 − (sinhx)2 = 1,

e dividendo per (coshx)2 si arriva all’identità

(coshx)2 =1

1− (tanhx)2

Infine,d

dxsinhx = coshx

d

dxcoshx = sinhx

d

dxtanhx =

1

(coshx)2 .

6Si osservi la somiglianza con l’identità fondamentale della (tri)goniometria (sinα)2 +(cosα)2 = 1.

Page 158: lezioni di matematica

150 CAPITOLO 7. INTEGRALE DI RIEMANN

-4,8 -4 -3,2 -2,4 -1,6 -0,8 0 0,8 1,6 2,4 3,2 4 4,8

-2,4

-1,6

-0,8

0,8

1,6

2,4

Figura 7.1: la funzione sinh

La funzione arctanh è definita come la funzione inversa di tanh. La suaderivata vale

d

dyarctanh y =

1ddx

tanhx= (coshx)2 =

1

1− y2,

dove y = tanhx. pertanto∫dy

1− y2= arctanh y + C.

Nelle figure 7.1, 7.2 e 7.3 appaiono i grafici qualitativi delle funzioni senoiperbolico, coseno iperbolico e tangente iperbolica.

7.9 Il polinomio di Taylor con resto integrale

Ricordiamo che, per una funzione f : (a, b) → R derivabile n volte, vale laformula

f(x) = Pn(x) +Rn(x),

dove

Pn(x) = f(x0) +n∑k=1

1

k!Dkf(x0)(x− x0)k

Page 159: lezioni di matematica

7.9. IL POLINOMIO DI TAYLOR CON RESTO INTEGRALE 151

-4,8 -4 -3,2 -2,4 -1,6 -0,8 0 0,8 1,6 2,4 3,2 4 4,8

-2,4

-1,6

-0,8

0,8

1,6

2,4

Figura 7.2: la funzione cosh

-4,8 -4 -3,2 -2,4 -1,6 -0,8 0 0,8 1,6 2,4 3,2 4 4,8

-2,4

-1,6

-0,8

0,8

1,6

2,4

Figura 7.3: la funzione tanh

Page 160: lezioni di matematica

152 CAPITOLO 7. INTEGRALE DI RIEMANN

è il polinomio di Taylor di ordine n e Rn(x) = f(x)− Pn(x) è l’errore che sicompie sostituendo Pn a f . Abbiamo già imparato che

limx→x0

Rn(x)

(x− x0)n= 0,

e che è possibile esprimere tale resto mediante la derivata (n + 1)– esima inun punto opportuno ξ:

Rn(x) =1

(n+ 1)!Dn+1f(ξ)(x− x0)n+1.

Il seguente risultato illustra un’ulteriore espressione per il resto.

Teorema 7.42 (Polinomio di Taylor con resto integrale). Sia f : (a, b)→ Runa funzione derivabile n+1 volte in (a, b), con derivata (n+1)–esima Dn+1fcontinua. Allora

Rn(x) =1

n!

∫ x

x0

(x− t)nDn+1f(t) dt.

Non dimostriamo tale formula, che richiederebbe la tecnica dell’indu-zione matematica. L’espressione integrale del resto Rn ha un’utilità quasiesclusivamente teorica, dato che la funzione integrale coinvolta è di difficilecalcolo.

7.10 Integrali impropri

Per quanto ci riguarda, solamente le funzioni limitate possono essere integratesu un intervallo limitato [a, b]. Da questa classe esulano le funzioni comex ∈ (0, 1) 7→ 1/

√x e x ∈ (1,+∞) 7→ 1/x2, per esempio. Osserviamo che si

tratta di funzioni continue, ed anzi derivabili nel loro dominio. L’integrale diLebesgue, la cui teoria è ben più complicata di quella vista finora, proponeuna teoria che supera queste restrizioni. Noi ci accontenteremo di introdurrei rudimenti dell’integrazione in senso generalizzato o improprio.

7.10.1 Funzioni illimitate

Per semplicità consideriamo una funzione f che sia definita e continua in unintervallo [a, b). La funzione f potrà non essere limitata. È lecito allora perogni c < b considerare l’integrale

∫ caf(x) dx e viene spontanea la seguente

Page 161: lezioni di matematica

7.10. INTEGRALI IMPROPRI 153

Definizione 7.43. Se nelle ipotesi dette esiste il limite

limc→b−

∫ c

a

f(x) dx,

questo viene detto integrale (improprio) di f in (a, b) e lo si indica ancoracon la notazione

∫ baf(x) dx.

È chiaro che possiamo estendere la definizione precedente al caso in cui fsia illimitata nell’estremo sinistro a dell’intervallo. Basta considerare il limite

limc→a+

∫ b

c

f(x) dx.

Quindi, tutto è stato ricondotto all’esistenza di un limite. Non sempre, peròè possibile calcolare esplicitamente gli integrali, ed è utile avere un teoremache garantisca l’integrabilità impropria di f .

Teorema 7.44. Sia ϕ una funzione continua in [a, b), a valori positivi percui esista l’integrale improprio in (a, b), e sia f una funzione continua in[a, b) tale che |f(x)| ≤ ϕ(x) per ogni x ∈ [a, b). Allora esiste l’integraleimproprio fra a e b di f .

Conviene pertanto costruire una scala di funzioni illimitate che ci permat-ta di decidere per confronto se una funzione ammetta integrale improprioo no. Consideriamo questa semplice famiglia di funzioni illimitate in ogniintorno del’estremo b:

x ∈ [a, b) 7→ 1

(b− x)α, (α > 0).

Ora, ∫ c

a

dx

(b− x)α=

{log(b− a)− log(b− c), α = 1

11−α(b− a)1−α − 1

1−α(b− c)1−α, α 6= 1.

Perciò nel caso α = 1 l’integrale improprio non esiste in quanto

limc→b−

∫ c

a

dx

(b− x)α= +∞.

Lo stesso accade per α > 1. Per α < 1

limc→b−

∫ c

a

dx

(b− x)α=

1

1− α(b− a)1−α

In conclusione, l’integrale improprio esiste se e solo se 0 < α < 1.

Page 162: lezioni di matematica

154 CAPITOLO 7. INTEGRALE DI RIEMANN

Diamo un cenno a un caso un po’ più generale. Supponiamo che la fun-zione f , definita in [a, b], sia continua con l’eventuale eccezione dei punti d1,d2, . . . ,dr. Allora si può suddividere l’intervallo (a, b) in un numero finito diintervalli, in modo che in ciascuno di essi la funzione f sia discontinua soloin un estremo (destro o sinistro). A ciascuno di questi intervalli si possonoapplicare le considerazioni fatte prima; se, per ciascuno di essi, esiste l’in-tegrale improprio, la somma di questi si definisce come integrale impropriodella f esteso all’intervallo (a, b).

In pratica, se nell’intervallo [a, b] ci sono due punti d1 e d2 dove la funzionef è illimitata, scriveremo∫ b

a

f(x) dx =

∫ d1

a

f(x) dx+

∫ d2

d1

f(x) dx+

∫ b

d2

f(x) dx.

Il primo e l’ultimo integrale ricadono nella definizione di integrale improprio.Il secondo è più delicato. Infatti f potrebbe essere illimitata in entrambigli estremi. Possiamo però ricondurlo a un integrale improprio con questo“trucco”: scegliamo un punto c ∈ (d1, d2) dove f sia continua, e scriviamo∫ d2

d1

f(x) dx =

∫ c

d1

f(x) dx+

∫ d2

c

f(x) dx.

Vediamo, ad esempio, se esiste∫ +1

−1dx√|x|.

La funzione integranda è illimitata per x → 0. Suddividiamo alloral’intervallo (−1, 1) nei due intervalli (−1, 0 e (0, 1). Si ha 7

limδ→0+

∫ −δ−1

1√−x

dx = limδ→0+

(−2√−δ + 2) = 2

e

limσ→0+

∫ 1

σ

1√xdx = lim

σ→0+(2− 2

√σ) = 2.

7.10.2 Funzioni definite su intervalli illimitati

Consideriamo ora il secondo caso, quello di una funzione definita su un inter-vallo illimitato, ad esempio del tipo (a,+∞). Supporremo che f sia continuain [a,+∞), e pertanto tutti gli integrali

∫ caf(x) dx hanno senso per c > a.

Definizione 7.45. Se nelle ipotesi dette esiste il limite

limc→+∞

∫ c

a

f(x) dx

questo viene detto l’integrale improprio di f in (a,+∞).7Lo studente noterà che abbiamo esplicitato il valore assoluto nei due integrali.

Page 163: lezioni di matematica

7.10. INTEGRALI IMPROPRI 155

Esempio:∫ +∞

0

dx

x2 + 1= lim

c→+∞

∫ c

0

dx

x2 + 1= lim

c→+∞arctan c =

π

2.

Come nel caso dell’intervallo limitato, sussiste il seguente criterio del con-fronto per l’integrale improprio su intervalli illimitati.

Teorema 7.46. Sia ϕ una funzione continua in [a,+∞), a valori positiviper cui esista l’integrale improprio in (a,+∞), e sia f una funzione continuain [a, b) tale che |f(x)| ≤ ϕ(x) per ogni x ∈ [a,+∞). Allora esiste l’integraleimproprio fra a e +∞ di f .

Costruiamo anche nel nostro caso una scala di funzioni che ci permetta,per mezzo del criterio del confronto, di decidere se un integrale improprioesiste. Consideriamo∫ c

1

dx

xα=

{1

1−αc1−α + 1

α−1, α 6= 1

log c, α = 1.

Se è α > 1, il limite per c→ +∞ è 1/(α− 1), mentre, per α ≤ 1, è +∞.

Osservazione 7.47. L’applicazione del criterio di confronto per la conver-genza degli integrali impropri richiede la costruzione di una funzione ϕ diconfronto, e non esistono ricette universali per questo.

Page 164: lezioni di matematica

156 CAPITOLO 7. INTEGRALE DI RIEMANN

Page 165: lezioni di matematica

Capitolo 8

Introduzione alle equazionidifferenziali ordinarie

Risolvere un’equazione significa trovare i valori di una o più incognite cherendono vera una certa uguaglianza. Lo studente sa risolvere le equazioniax = b, ax2 + bx+ c = 0, 2x = 4, e altre ancora. In questi esempi, l’incognitax è un numero.1

È possibile scrivere equazioni in cui l’incognita sia una funzione e nongià un singolo numero? Un attimo di riflessione ci lascia intendere che ilsenso dell’uguaglianza da verificare vada inteso come un’uguaglianza puntoper punto. Per esempio, cercare una funzione f tale che

f 2 − 1 = 0

può essere interpretato come cercare una funzione f tale che f(x)2 − 1 = 0per ogni x appartenente al dominio di f . Queste solo le cosiddette equazionifunzionali, e sono un argomento davvero complesso.

In questo capitolo tratteremo un diverso tipo di equazioni, quelle in cuil’incognita è una funzione ma l’uguaglianza da verificare coinvolge le derivatedell’incognita. Sarà comodo indicare le derivate con apici: y′ invece di Dy,y′′ invece di D2y, ecc.

Definizione 8.1. Un’equazione nell’incognita y : (a, b)→ R del tipo

F (x, y(x), y′(x), y′′(x), . . . , y(n)(x)) = 0, x ∈ (a, b) (8.1)

si chiama equazione differenziale ordinaria di ordine n. L’ordine n sta adindicare l’ordine di derivazione più alto della funzione incognita y che effet-tivamente compare.

1Che intenderemo sempre reale. In matematica si studiano equazioni le cui inconitedevono appartenere ad insiemi specificati, ad esempio Z o Q.

157

Page 166: lezioni di matematica

158 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

Definizione 8.2. L’equazione (8.1) si dice lineare se è della forma

an(x)y(n)(x) + an−1y(n−1)(x) + · · ·+ a0(x)y(x) = f(x) (8.2)

e lineare omogenea se f = 0.

Ora che sappiamo che cosa sia un’equazione differenziale2 vogliamo anchedire che cosa sia una sua soluzione.

Definizione 8.3. Una soluzione di (8.1) è una funzione y : (a, b) → R, de-rivabile n volte in (a, b) e verificante (8.1) per ogni x ∈ (a, b). L’insieme ditutte le soluzioni di (8.1) in (a, b) si chiama integrale generale di (8.1) in(a, b).

È importantissimo sottolineare che l’insieme di definizione della soluzionenon è un dato del problema, bensì parte dell’incognita. In particolare, nonè possibile pretendere che le soluzioni di una data equazione differenzialerisultino definite su un insieme da noi specificato. In termini equivalenti,aggiungere il dominio della soluzione ai dati dell’equazione può portare a unproblema privo di soluzioni.

Un’equazione differenziale ordinaria che sappiamo già risolvere è

y′ = f(x),

dove f è una funzione continua assegnata. Il teorema fondamentale del calco-lo ci dice che, trovata una primitiva F di f in un intervallo (a, b), la soluzionegenerale è y(x) = F (x) + C, al variare di C ∈ R.

Nei paragrafi seguenti proponiamo i metodi risolutivi per qualche altrotipo di equazioni differenziali del primo ordine. Non diremo quasi niente dellateoria che sta alla base. Lo studente tenga bene a mente che non esistonometodi per risolvere una generica equazioni differenziale ordinaria medianteformule elementari.

8.1 Equazioni differenziali lineari del primo or-dine

In questa sezione, troviamo tutte le soluzioni di una equazione differenzialedel primo ordine scritta nella forma

y′ + a(x)y = f(x) (8.3)2Sottintenderemo spesso l’aggettivo ordinaria.

Page 167: lezioni di matematica

8.1. EQUAZIONI DIFFERENZIALI LINEARI DEL PRIMO ORDINE159

Quando si studiano le equazioni differenziali lineari, conviene sempre appli-care il principio di sovrapposizione. Esso consiste nelle seguenti due osserva-zioni:

1. se y1 e y2 sono soluzioni della stessa equazioni differenziale lineareomogenea, allora c1y1 + c2y2, al variare di c1, c2 ∈ R, è ancora unasoluzione;

2. se y1 e y2 sono soluzioni della stessa equazioni differenziale lineare contermine noto f , allora y1 − y2 è una soluzione della stessa equazionedifferenziale lineare con f = 0.

Il senso pratico di questo principio è che per trovare l’integrale generale diun’equazione differenziale lineare non omogenea, basta trovare l’integrale ge-nerale ella corrispondente equazione omogenea e sommargli una soluzioneparticolare dell’equazione non omogenea. Il vantaggio è che la soluzioneparticolare può essere individuata con ogni mezzo, anche casualmente.3

Per la nostra equazione (8.3), cominciamo a trovare l’integrale generaledella corrispondente equazione omogenea

y′ + a(x)y = 0. (8.4)

Nel seguito, supporremo sempre che a sia una funzione continua. Dividendoper y, si ottiene formalmente

0 =y′

y+ a(x) =

d

dxlog y(x) + a(x),

cioèlog y(x) = −A(x)

dove A è una primitiva di a.4 Il suggerimento che ne ricaviamo è che lafunzione

y0(x) = exp

(−∫ x

α

a(s) ds

)(8.5)

dove α è un numero arbitrariamente fissato, sia una soluzione di (8.4). Lostudente verifichi per (semplice) esercizio che y0 è davvero una soluzione.L’integrale generale di (8.4) è

y(x) = cy0(x), c ∈ R.3Questa è soltanto una frase ad effetto. Nessuno individua le soluzioni particolari

casualmente, ma sempre seguendo qualche tecnica ragionevole.4Ricordiamo che, per definizione di primitiva, A′(x) = a(x).

Page 168: lezioni di matematica

160 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

Infatti,d

dx

y(x)

y0(x)=y′y0 − y′0y

y20

=−ayy0 + ay0y

y20

= 0,

e dunque y/y0 è costante.

Per trattare il caso non omogeneo, proponiamo un metodo alquanto po-tente e generale: quello della variazione delle costanti. Al di là della denomi-nazione paradossale, è un metodo che funziona sempre, anche se può portarea calcoli problematici. Lo schema è il seguente. Si risolve l’equazione omoge-nea e si determina y0 come sopra. A questo punto, cerchiamo una soluzioneparticolare della forma

yf (x) = λ(x)y0(x)

Capiamo la ragione del nome: facciamo finta che la costante reale c che de-scrive l’integrale generale di (8.4) sia una funzione (derivabile), e cerchiamodi sceglierla così da avere una effettiva soluzione dell’equazione non omoge-nea. Inserendo yf nell’equazione (8.3), ci accorgiamo che yf è una soluzionese e solo se

λ′(x)y0(x) + λ(x) (y′0(x) + a(x)y0(x)) = f(x);

basta quindi scegliere λ in modo che

λ′(x) =f(x)

y0(x).

Questa è un’equazione differenziale del tutto banale, dato che si risolve sem-plicemente scegliendo una primitiva della funzione a secondo membro. Inconclusione, l’integrale generale dell’equazione (8.3) è

y(x) = y0(x)

(c+

∫ x

α

f(s)

y0(s)ds

), (8.6)

dovey0(x) = exp

(−∫ x

α

a(s) ds

).

Inoltre, ciascuna di queste soluzioni è univocamente determinata dal valoreassunto in α, c = y(α).

Osservazione 8.4. Esiste un approccio più diretto al caso non omogeneo.Partiamo dall’equazione y′+a(x)y = f(x) e poniamo v(x) = exp(

∫a(x) dx)y(x).

La derivata di v si calcola facilmente:

v′(x) = eRa(x) dxy′(x) + a(x)e

Ra(x) dxy(x)

= eRa(x) dx (y′ + a(x)y) .

Page 169: lezioni di matematica

8.2. EQUAZIONI DEL PRIMO ORDINE A VARIABILI SEPARABILI161

Quindi y risolve la nostra equazione differenziale non omogenea se, e solo se,v risolve l’equazione differenziale

v′ = eRa(x) dxf(x).

Ma allora v(x) =∫e

Ra(x) dxf(x) dx + C, e possiamo ricavare la soluzione

generale5 y:

y(x) = e−Ra(x) dx

(∫e

Ra(x) dxf(x) dx+ C

).

Qualche volta, la forma specifica di f a secondo membro può suggerireuna soluzione particolare. Per esempio, una soluzione di y′ + y = ex puòessere suggerita dal fatto ben noto che, per ogni λ, µ ∈ R,

d

dx(λeµx) = λµeµx.

Si verifica agevolmente che λ = 1/2 e µ = 1 fornisce la soluzione yf (x) =(1/2)ex. Considerazioni analoghe valgono per funzioni a secondo membro ditipo polinomiale e goniometrico.

8.2 Equazioni del primo ordine a variabili se-parabili

Discutiamo ora alcuni esempi di equazioni differenziali del primo ordine nonlineari

y′ = f(x, y), (8.7)

dove f è una funzione di due variabili assegnata. Una soluzione di (8.7) èuna funzione y derivabile con continuità in un intervallo (a, b) e tale che

y′(x) = f(x, y(x)) per ogni x ∈ (a, b).

Discuteremo inoltre la risolubilità del problema di Cauchy, ovvero del proble-ma di trovare una soluzione di (8.7) soddisfacente la condizione y(x0) = y0,

5Qualche studente potrebbe criticare l’uso un po’ leggero del simbolo di integrazioneindefinita: in particolare, a che serve la costante C se l’integrale indefinito continene giàtutte le infinite primitive? La critica è formalmente corretta, e possiamo dire che nellaformula seguente gli integrali denotano una primitiva scelta liberamente fra le infinite adisposizione.

Page 170: lezioni di matematica

162 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

(x0, y0) essendo un punto del piano cartesiano (appartenente al dominio dif). In altre parole, discuteremo la risolubilità del sistema{

y′(x) = f(x, y(x))y(x0) = y0.

(8.8)

Geometricamente il problema consiste, dopo aver assegnato in ogni punto delpiano (x, y) un numero f(x, y), nel trovare una funzione y il cui grafico passaper (x0, y0) in ogni punto (x, y(x)) ha una pendenza assegnata f(x, y(x)).Purtroppo non possiamo dire quasi nulla di astratto: la comparsa di unafunzione di due variabili porta tutta la discussione ad un livello di matematicapiù avanzato rispetto al nostro. Questa consapevolezza dei nostri limiti non ciimpedirà tuttavia di imparare a risolvere alcuni tipi di equazioni differenzialidi tipo speciale.

I due esempi che seguono mostrano alcuni comportamenti inattesi, almenoa un primo sguardo.

Non unicità. Per ogni a < 0 < b, le funzioni

y(x) =

−1

4(x− a)2, x < a

0, a ≤ x ≤ b14(x− b)2, x > b

sono tutte funzioni derivabili con continuità in R. 6 Inoltre ognuna di esserisolve il problema di Cauchy{

y′(x) =√|y(x)|

y(0) = 0.

In contrasto con quel che capita con le equazioni lineari del primo ordine dovela soluzione dell’equzione è univocamente determinata dal valore della stessain un dato punto, questa equazione non lineare presenta infinite soluzionidiverse.

Esplosione in tempo finito. La funzione y(x) = 1/(1 − x), definita perogni x ∈ (−∞, 1), è soluzione del problema{

y′(x) = y(x)2

y(0) = 1.

6Lo studente verifichi attentamente questa affermazione.

Page 171: lezioni di matematica

8.2. EQUAZIONI DEL PRIMO ORDINE A VARIABILI SEPARABILI163

In questo caso, pur essendo l’equazione definita per ogni possibile coppia(x, y) del piano cartesiano, la soluzione y è definita solo su un intervallo limi-tato superiormente. Di più, l’ampiezza dell’intervallo dipende dal valore ini-ziale. Ad esempio per λ > 0 la funzione yλ(x) = λ/(1− λx), x ∈ (−∞, 1/λ),è la soluzione del problema di Cauchy{

y′(x) = y(x)2

y(0) = λ.

Osserviamo che. per x → 1/λ, yλ(x) → +∞. Per questa ragione, parliamodi esplosione della soluzione al “tempo” x = 1/λ.

Per ragioni di tempo ed opportunità, ci limiteremo a considerare solo ilcaso delle equazioni a variabili separabili, cioè equazioni differenziali del tipo

y′(x) = f(x)g(y(x)),

dove f : (a, b) → R e g : (c, d) → R sono funzioni di una sola variabile.Il seguente teorema ci tranquillizza rispetto all’esistenza e all’unicità dellasoluzione.

Teorema 8.5. Siano f : (a, b) → R e g : (c, d) → R due funzioni derivabilicon continuità, dove i due intervalli di definizione possono essere eventual-mente illimitati. Per ogni x0 ∈ (a, b), y0 ∈ (c, d) il problema di Cauchy{

y′(x) = f(x)g(y(x))y(x0) = y0

possiede una ed una sola soluzione y : (α, β)→ R.

Quindi, se le nostre equazioni a variabili separabili sono unicamente risol-vibili (sotto le ipotesi del teorema, ovviamente), resta da capire se sia pos-sibile scrivere esplicitamente le soluzioni. Vediamo un modello tratto dallaFisica.

A volte in un processo di crescita intervengono fattori esterni. È il ca-so di una popolazione (ad esempio di batteri) la cui crescita dipende dallaproduzione di cibo. Se si mantiene costante il cibo disponibile, sufficiente di-ciamo per L elementi della popolazione, ci si può aspettare che la rapidità dicrescita tenda a zero quando il numero di individui y tende a L. Un modellosemplice è l’equazione differenziale

y′ = ky(

1− y

L

),

Page 172: lezioni di matematica

164 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

detta equazione logistica. Il parametro k è una costante del problema, ecerchiamo le soluzioni del problema di Cauchy{

y′ = ky(1− y

L

)y(0) = λ.

Il Teorema 8.5 dà in particolare l/unicità della soluzione. Vediamo di “indo-vinare” una soluzione del nostro problema.

Se λ = L, allora la soluzione costante y(x) = L per ogni x ∈ R è soluzione.Se λ 6= L, riscriviamo formalmente l’equazione come

dy

y(1− y

L

) = k dx

che suggerisce per integrazione dei due membri

log

∣∣∣∣ y

y − L

∣∣∣∣ = kx+ C, C ∈ R.

Ricavando y,

y(x) =cL

c+ e−kx, c ∈ R.

Imponendo che y(0) = L, ricaviamo la condizione

cL

c− 1= λ

che identifica esattamente l’unica soluzione nel caso λ 6= L. Notiamo che noavremmo potuto ricavare la soluzione costante in questo modo.

Cerchiamo adesso di adattare la tecnica dell’esempio all’equazione a va-riabili separabili generale. Notiamo che se g(y) = 0, la funzione y(x) = y perogni x è una soluzione. Quindi, se y è una soluzione allora o y è costanteoppure y(x) non annulla mai la g. In quest’ultimo caso, g(y(x)) 6= 0 per ognix, e dividendo l’equazione per g(y(x)) si ottiene

y′(x)

g(y(x))= f(x).

Se integriamo fra x0 e x, con la formula di integrazione per sostituzionearriviamo a ∫ y(x)

y0

1

g(y)dy =

∫ x

x0

y′(t)

g(y(t))dt =

∫ x

x0

f(s) ds.

Page 173: lezioni di matematica

8.2. EQUAZIONI DEL PRIMO ORDINE A VARIABILI SEPARABILI165

Chiamando F una primitiva di f e G una primitiva di 1/g, abbiamo ricavatola soluzione in forma implicita:

G(y(x))−G(y0) = F (x)− F (x0).

Ora, è possibile dimostrare che G è strettamente monotona, dunque inverti-bile. Possiamo ricavare y(x) dalla relazione sopra:

y(x) = G−1 (F (x)− F (x0) +G(y0)) .

In teoria, abbiamo trovato l’unica soluzione esplicitamente. In pratica, oc-corre una dose di sano realismo: il calcolo delle primitive F e G, e soprattuttoil calcolo della fuzione inversa di G, sono spesso di difficoltà insormontabile.Con questo non vogliamo incoraggiare lo studente a catalogare come impos-sibile la risoluzione delle equazioni differenziali: gli esercizi dei temi d’esamesono costruiti in modo che lo studente possa fare esplicitamente tutti i calcolinecessari ad arrivare alla formula della soluzione.

Esempio: capitale ed interessi. Supponiamo di depositare in banca uncerto capitale u0 ad un tasso di interesse p computato continuamente. Questosignifica che in un intervallo di tempo infinitesimo dt il capitale aumentadi una somma du = pu(t) dt proporzionale alla durata dell’intervallo e alcapitale stesso u(t). Dividendo7 per dt, otteniamo l’equazi one differenziale

u′(t) = pu(t).

Essendo a variabili separabili, la soluzione si ottiene facilmente, ed è espressadalla formula

u(t) = u0ept.

Supponiamo ora di ritirare con regolarità una certa rendita (costante) b. Inquesto caso l’andamento del capitale risponderà all’equazione

u′(t) = pu(t)− b.

È ancora a variabili separabili, e la sua soluzione si ricava risolvendo rispettoa u l’equazione

1

plog(pu− b) = t+ C,

cioèu(t) =

1

p

(Cept + b

).

7Questi ragionamenti sono formali, ed infatti i veri interessi vengono computati adintervalli di tempo prefissati.

Page 174: lezioni di matematica

166 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

La costante C si ricava imponendo che u(0) = u0, da cui u0 = C+bp

, e dunqueC = pu0 − b. In conclusione

u(t) =1

p

[(pu0 − b)ept + b

].

Si danno tre casi.

1. b < pu0. In questo caso il capitale aumenta con il tempo, anche semeno velocemente di quanto avveniva senza prelievo. In effetti, tuttoavviene come se si fosse partiti da un capitale iniziale u0− b

p, remunerato

all’interesse p, più un capitale fisso b/p non remunerato.

2. b > pu0. Se si preleva troppo, il capitale diminuisce, e si estinguein un tempo T che può essere calcolato imponendo che u(T ) = 0.Esplicitamente, dobbiamo risolvere rispetto a T l’equazione

(pu0 − b)epT + b = 0.

Ricavando T , troviamo

T =1

plog

b

b− pu0

.

3. b = pu0. In questo caso il capitale rimane costante, sempre uguale au0 = b/p.

Notiamo che il capitale u0 ed il prelievo b possono essere negativi: se b > pu0

stiamo parlando di un prestito che viene estinto con versamenti regolari. Avolte può essere interessante sapere quanto occorre versare per estinguereun prestito u0 in un certo numero T di anni. Si deve semplicemente porreu(T ) = 0 e ricavare b:

b = pu0epT

epT − 1.

Se si vuole estinguere il prestito di 100 000 euro al 10% in 10 anni, si dovràpagare una rata di

b = 10000e

e− 1≈ 15800

euro all’anno, cioè circa 1317 euro al mese. Questo esempio è tratto da [13].

Page 175: lezioni di matematica

8.3. EQUAZIONI LINEARI DEL SECONDO ORDINE 167

8.3 Equazioni lineari del secondo ordine a coef-ficienti costanti

Come detto nell’introduzione al capitolo, le equazioni lineari possiedono ca-ratteristiche particolari. In questo paragrafo vedremo come utilizzare la linea-rità dell’equazione per determinare le soluzioni. Per semplicità, ci limiteremoalle equazioni lineari del secondo ordine a coefficienti costanti:

ay′′ + by′ + cy = f, (8.9)

dove a, b e c sono numeri reali mentre f è una funzione assegnata.

Osservazione 8.6. Ogni equazione di ordine due può essere ricondotta adun sistema di equazioni di ordine uno. Consideriamo ad esempio la (8.9), eintroduciamo l’incognita ausiliaria v = y′. Allora la (8.9) equivale al sistema{

av′ + bv + cy = fy′ = v.

Da un punto di vista teorico, si tratta di un risultato di importanza fonda-mentale, poiché permette di studiare solamente i sistemi di equazioni diffe-renziali di primo ordine. Dal punto di vista pratico, spesso è più convenientesfruttare tecniche particolari, e la riduzione ad un sistema non offre moltoaiuto.

Come per le equazioni lineari del primo ordine, consideriamo innanzituttoil caso omogeneo f = 0.

L’equazione ay′′+by′+cy = 0 suggerisce la ricerca di soluzioni y tali che y,y′ e y′′ siano multipli di una medesima funzione. Cerchiamo allora una solu-zione y(x) = erx, per oppurtuni valori di r ∈ R. Sostituendo nell’equazione,troviamo in effetti

erx(ar2 + br + c

)= 0.

Questa identità può essere soddisfatta soltanto se

ar2 + br + c = 0 (8.10)

La teoria delle equazioni algebriche di secondo grado ci dice che le soluzionireali di (8.10) sono due, una8 oppure nessuna a seconda che il discriminante

8Gli insegnanti delle scuole superiori amano parlare di due radici coincidenti. Nonè sbagliato, ed anzi in certi casi è di grande aiuto usare tale espressione. Per i nostriscopi, sarebbe come dire che oggi indosso due paia di pantaloni coincidenti: logicamenteineccepibile ma francamente superfluo. Tutto si sitema introducendo la molteplicità delleradici di un polinomio, concetto comunque be al di là dei limiti del nostro corso.

Page 176: lezioni di matematica

168 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

∆ = b2−4ac sia positi vo, nullo oppure negativo. Schematicamente, vediamocome trovare le soluzioni nei tre casi.

(1) Due radici reali. L’equazione (8.10) possiede due radici reali distinter1 e r2, e dunque le due funzioni

x 7→ er1x, x 7→ er1x

sono soluzioni. Per il principio di sovrapposizione, l’integrale generale dell’e-quazione omogenea è

y(x) = c1er1x + c2e

r2x. (8.11)

(2) Una radice reale. Se ∆ = 0, l’unica radice reale è

r = − b

2a.

Dunque abbiamo trovato una soluzione

x 7→ e−b2ax

per l’equazione omogenea. Malauguratamente, questa non basta a descriverel’integrale generale. Possiamo tuttavia provare a cercare una soluzione dellaforma

x 7→ e−b2axu(x).

Sostituendo, otteniamo la condizione (r = −b/(2a))

0 = e−b2ax((ar2 + br + c)u+ au′′ + (2ar + b)u′

)= au′′.

Dunque u′′ = 0, e integrando due volte u(x) = c1 + c2x. L’integrale generaledella nostra equazione omogenea è pertanto

y(x) = e−b2ax (c1 + c2x) . (8.12)

(3) Nessuna radice reale. Questo caso è sempre il più difficile da ana-lizzare. Non avendo a disposizione l’algebra dei numeri complessi, è piutto-sto macchinoso costruire le soluzioni. Ci limitiamo pertanto a proporle “excathedra”. Definiamo

α =b

2a, ω =

√4ac− b2

2a.

Page 177: lezioni di matematica

8.3. EQUAZIONI LINEARI DEL SECONDO ORDINE 169

L’integrale generale nel caso ∆ < 0 si scrive

y(x) = Ae−αx cos(ωx+ ϕ) (8.13)

al variare delle costanti A ≥ 0 e ϕ ∈ [−π/2, π/2). In alternativa, le formuledi addizione per la funzione coseno dicono che l’integrale generale può esserescritto

y(x) = e−αx (C1 sin(ωx) + C2 cos(ωx)) , (8.14)

al variare delle costanti reali C1 e C2. Questa formula è meno concisa dellaprecedente, ma spesso preferibile per fare i calcoli.

Il caso non omogeneo si discute usando il principio di sovrapposizione:si trova l’integrale generale dell’equazione omogenea e si somma ad una so-luzione particolare dell’equazione non omogenea. Tutto sta nel calcolarequest’ultima. Vi sono essenzialmente tre modi, per le equazioni del secondoordine a coefficienti costanti.

1. Procedere per tentativi. Ad esempio, se f è un polinomio di grado n,si cerca una soluzione particolare che sia un polinomio di grado n+ 2.Questa tecnica è la più semplice ma anche la più rischiosa, dato chefunziona solamente per classi molto ristrette di funzioni f .

2. Utilizzare il metodo della variazione delle costanti. Siano y1 e y2 due so-luzioni dell’equazione omogenea. Si cerca una soluzione dell’equazionenon omogenea del tipo

yf (x) = c1(x)y1(x) + c2(x)y2(x), (8.15)

dove c1 e c2 sono funzioni incognite. Oltre al fatto che yf risolva l’equa-zione, si impone la condizione ausiliaria9 c′1(x)y1(x) + c′2(x)y2(x) = 0.Per trovare le incognite c1 e c2 occorre perciò risolvere il sistema{

c′1(x)y1(x) + c′2(x)y2(x) = 0c′1(x)y′1(x) + c′2(x)y′2(x) = f(x).

(8.16)

A dispetto delle apparenze, questo sistema non è di difficile soluzione:basta ricavare algebricamente c′1 e c′2, e integrare.

9Se avessimo il tempo per la teoria generale delle equazioni differenziali lineari, po-tremmo far vedere che questa condizione è tutt’altro che artificiosa. Si veda [9] per idettagli.

Page 178: lezioni di matematica

170 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

3. Utilizzare la formula di Duhamel.10 Se u è la soluzione del problema diCauchy

au′′ + bu′ + c = 0u(0) = 0u′(0) = 1,

(8.17)

allorayf (x) =

∫ x

0

u(x− s)f(s) ds.

Si potrebbe dimostrare che questa espressione altro non è che una con-seguenza del metodo di variazione delle costanti. L’esperienza didatticainsegna che questo metodo risolutivo non è particolarmente gradito aglistudenti.

Esempio 8.7. Applichiamo tutti questi metodi all’equazione

y′′ − y = x2. (8.18)

La soluzione generale dell’equazione omogenea y′′ = y = 0 è y(x) = c1ex +

c2e−x. Poiché il secondo membro dell’equazione è un polinomio di grado

2, cerchiamo un polinomio di grado 4 che sia una soluzione particolare. Ilgenerico polinomio di quarto grado ha la forma a0 +a1x+a2x

2 +a3x3 +a4x

4,e sarà una soluzione di (8.18) se e solo se

12a4x2 + 6a3x− 2a2 − a0 − a1x− a2x

2 − a3x3 − a4x

4 = x2

per ogni x. Uguagliando i coefficienti delle stesse potenze di x, dobbiamorisolvere il sistema

a4 = 0

a3 = 0

12a4 − a2 = 1

6a3 − a1 = 0

2a2 − a0 = 0.

Operando per sostituzione, troviamo molto facilmente l’unica soluzione a0 =−2, a1 = 0, a2 = −1, a3 = a4 = 0. Quindi una soluzione particolare è lafunzione polinomiale x 7→ −x2 − 2.

Se usiamo invece il metodo della variazione delle costanti, dobbiamorisolvere il sistema {

exc′1 + e−xc′2 = 0

exc′1 − e−xc′2 = x2,

10Questa formula è spesso attribuita a Cauchy, che la utilizzò in una forma equivalentema diversa da quella che riportiamo. È interessante osservare che la formula di Duhamelvale per tutte le equazioni differenziali lineari.

Page 179: lezioni di matematica

8.3. EQUAZIONI LINEARI DEL SECONDO ORDINE 171

che ci porta immediatamente a

c′1 =1

2x2e−x, c′2 = −1

2x2ex.

Integrando, c1 = (−12x2 − x − 1)e−x, c2 = (−1

2x2 + x − 1)ex, e quindi la

soluzione particolare è

yf (x) = c1ex + c2e

−x = −x2 − 2.

Utilizzando infine la formula di Duhamel, si trova che

yf (x) =

∫ x

0

(1

2ex−2 − 1

2es−x

)s2 ds

=1

2ex∫ x

0

s2e−s ds− 1

2e−x

∫ x

0

s2es ds.

Lasciamo al lettore il calcolo di questi ultimi due integrali (suggerimento:integrare per parti due volte). Alla fine si giunge allo stesso risultato: yf (x) =−x2 − 2. In conclusione, la soluzione generale di (8.18) è

y(x) = c1ex + c2e

−x − x2 − 2.

Sembra evidente che, almeno per funzioni f di tipo molto particolare, con-viene almeno tentare di indovinare una soluzione particolare yf con il primometodo.

Esempio 8.8. Vogliamo risolvere11 l’equazione

y′′ + 2y′ + y =e−x

x.

Osserviamo che il polinomio associato all’equazione è λ2+2λ+1 = 0, che pos-siede la radice doppia λ = −1. Dunque la soluzione generale dell’equazioneomogena sarà y0(x) = C1e

−x + C2xe−x. Occorre determinare una soluzione

particolare dell’equazione completa. Poiché sembra improbabile indovinaread occhio una soluzione, ricorriamo alla formula di Duhamel. La soluzionedel problema

y′′ + 2y′ + y = 0

y(0) = 0

y′(0) = 1

11Con questa espressione intenderemo sempre che vogliamo calcolare la soluzionegenerale.

Page 180: lezioni di matematica

172 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

è la funzione y(x) = xe−x: basta imporre le condizioni y(0) = 0 e y′(0) = 1e determinare le giuste costanti C1 e C2. Quindi la teoria ci dice che

yf (x) =

∫ x

1

y(x− s)e−s

sds =

∫ x

1

(x− s)e−(x−s) e−s

sds

=

∫ x

1

x− ss

e−2−t+s ds =

∫ x

1

x− ss

e−x ds

= e−x∫ x

1

x− ss

ds = e−x [x log |s| − s]s=xs=1

= e−x (x log x− x+ 1) .

Un’osservazione: abbiamo integrato fra 1 ed x invece che fra 0 ed x perchéla funzione a secondo membro dell’equazione non è definita in 0. Infine, lasoluzione generale della nostra equazione è

y(x) = C1e−x + C2xe

−x + x(log x− 1)e−x.

Per inciso, si potrebbe far vedere che la formula di Duhamel è solo uncaso particolare del metodo della variazione delle costanti. La formula diDuhamel sembra il metodo più invitante, sebbene sia in realtà abbastanzainsidiosa a causa degil integrali complicati a cui conduce.

Quasi tutto quello che abbiamo esposto è tratto da [11]. Numerosi esempi,modelli e tecniche risolutive per le equazioni differenziali ordinarie si trovanonei primi capitoli del libro [17]. Pur non presentando alcuna giustificazioneteorica dei risultati, in questo agile libretto lo studente interessato può facil-mente impratichirsi con la risoluzione delle equazioni differenziali più comuni.Si veda anche [8].

Page 181: lezioni di matematica

Capitolo 9

Metodi del calcolo approssimato

In quest’ultimo capitolo, affronteremo succintamente alcuni problemi del-l’Analisi Numerica. Pur tenendoci a un livello di difficoltà davvero basso,abbiamo l’ambizione di proporre alcuni metodi di calcolo approssimato. Inparticolare, proporremo il metodo di interpolazione di Lagrange per costruireun polinomio che unisca dei punti del piano cartesiano. Di seguito, vedre-mo tre modi per tovare approssimazioni numeriche degli integrali definiti.Trattandosi di argomenti complementari al corso, non ci soffermeremo sumolti dettagli, né discuteremo la questione più importante di tutta l’AnalisiNumerica: quella della precisione dei metodi.

9.1 Interpolazione polinomiale

Supponiamo che, durante un esperimento di laboratorio, le misurazioni ciforniscano delle coppie numeriche rappresentative di una quantità fisica ochimica in relazione a un’altra quantità variabile:

(x1, y1), (x2, y2), . . . , (xn, yn).

La prima cosa che ci viene in mente di fare è di segnare tali punti nel pianocartesiano, cenrcando di capire se esista una relazione fra i valori delle x equelli delle y.1

Innanzitutto, la presenza di punti con uguale ascissa e diverse ordinatecreerebbero problemi insormontabili, perché non ci sarebbe speranza di avere

1Chi scrive è un matematico “puro”, e in queste situazioni è convinto che dieci o centopunti nel piano non servano assolutamente a niente. Anche se fossero allineati lungouna retta orizzontale, la logica matematica non ci permetterebbe di trarre la conclusioneche ogni scienziato “applicato” ne trarrebbe. Chi ci dice che, facendo anche solo unamisurazione in più, non troveremmo un punto completamente disallineato?

173

Page 182: lezioni di matematica

174 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

la y in funzione della x. Sbarazziamoci fin d’ora di tale caso, peraltro ridicoloda un punto di vista sperimentale. Infatti, se alla stessa x corrispondesserodue valori sperimentali distinti della y, dovremmo concludere che non siamocapaci di fare l’esperimento.

In seconda battuta, fin da bambini ci siamo divertiti a “unire i puntini”sulle riviste di enigmistica. Questo metodo funziona sempre, e produce unafunzione continua il cui grafico è la spezzata che congiunge i dati sperimentali.Quasi sicuramente, questa funzione non sarà però derivabile nei punti dicongiunzione. E soprattutto sarebbe presuntuoso ipotizzare che proprio queipochi dati calcolati siano gli “spigoli” della vera funzione che lega le ordinatealle ascisse. Raramente i fenomeni macroscopici misurabili in laboratoriopresentano comportamenti spigolosi.

Ben consci di tutte queste difficoltà, rivolgiamo allora lo sguardo versouna classe di funzioni che uniscono vari pregi: facilità di derivazione, diintegrazione, di calcolo dei valori. Stiamo parlando dei polinomi.

Ora, c’è un evidente legame fra il numero di dati sperimentali e il grado delpolinomio che vogliamo trovare. Se abbiamo due coppie di punti, possiamounirli con una retta univocamente individuata2, ma possiamo anche unirlicon infiniti rami di parabole variamente disposte nel piano cartesiano. Perconvincere di ciò anche lo studente più scettico, scegliamo i due punti (−1, 0)e (1, 0). La retta orizzontale y = 0 li congiunge, ma anche tutte le paraboley = a(x2 − 1) al variare di a ∈ R.

Riassumendo, con due punti abbiamo un unico polinomio di grado 1 =2− 1, e infiniti polinomi di grado maggiore di 1. Per tre punti, la geometriaanalitica delle scuole superiori ci assicura che esiste una ed una sola para-bola che li unisce, ma è facile costruire infiniti polinomi di quarto grado chepassano per tali punti. Ci sembra di vedere un legame fra il numero n + 1di dati sperimentali e il grado n del polinomio univocamente determinato. Ilseguente teorema non solo ci conforta in questa convinzione, ma ci fornisceuna formula esplicita per scrivere tutti i coefficienti del polinomio di grado nvoluto.

Teorema 9.1 (Polinomio interpolatore di Lagrange). Dati n+1 punti distintix0, x1, . . . , xn e n+1 numeri reali y0, y1, . . . , yn non necessariamente distinti,esiste uno ed un solo polinomio P di grado (minore o uguale a) n tale cheP (xj) = yj per ogni j = 0, 1, 2, . . . , n. Questo polinomio è dato da

P (x) =n∑k=0

ykAk(x)

Ak(xk), (9.1)

2Il famoso assioma “per due punti passa una ed una sola retta”.

Page 183: lezioni di matematica

9.1. INTERPOLAZIONE POLINOMIALE 175

doveAk(x) =

∏j 6=k

(x− xj).

Certo, il polinomio interpolatore ha un aspetto vagamente misterioso.Il simbolo

∏di produttoria è analogo a quello della sommatoria: serve a

scrivere brevemente i prodotti invece che le somme. Vediamo di spiegarebrevemente perché il polinomio di Lagrange ha proprio questo aspetto. Par-tendo dal caso molto semplice di due punti x0 e x1, consideriamo le dueespressioni x − x0 e x − x1. La prima si annulla per x = x0, la seconda perx = x1. Se poi le dividiamo opportunamente, troviamo le espressioni

x− x0

x1 − x0

,x− x1

x0 − x1

.

La prima vale 1 per x = x1. mentre la seconda vale 1 per x = x0. Pertantol’espressione

y0x− x0

x1 − x0

+ y1x− x1

x0 − x1

vale y0 per x = x0 e y1 per x = x1. Ovviamente, al variare di x ∈ R,questa espressione rappresenta un polinomio di primo grado. Confrontandolocon il Teorema precedente, abbiamo costruito esattamente il polinomio diLagrange di primo grado. Non è difficile convincersi che il generico polinomiodi Lagrange di grado n si costruisce seguendo lo stesso principio: prima sitrovano n polinomi Aj, j = 0, 1, . . . , n, che hanno la proprietà

Aj(xi) = 0 per ogni i 6= j,

e poi si divide per Aj(xj) in modo da ottenere un’espressione polinomiale chevale 1 per x = xj. Infine si moltiplica ognuna di queste espressioni per yj esi somma rispetto a j. Il risultato è esattamente il polinomio interpolatoredi Lagrange.

Osservazione. Un approccio più concreto è il seguente. Vogliamo unpolinomio di grado (al più) n, e lo scriviamo nella forma

P (x) =n∑k=0

akxk.

Come troviamo i coefficienti incogniti a0, a1, ecc.? È semplice: imponendole condizioni

P (xj) = yj, j = 0, . . . , n.

Page 184: lezioni di matematica

176 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

Ricaviamo un sistema di n + 1 equazioni lineari nelle n + 1 incognite aj,j = 0, . . . , n. Risolvendo questo banale3 sistema, ricaveremo il polinomiointerpolatore. Salvo errori di calcolo, l’unicità di tale polinomio significa chead esso possiamo arrivare in qualunque modo ci faccia comodo.

Trovato il polinomio interpolatore, che ne facciamo? In primo luogo, lopossiamo usare proprio per interpolare, cioè per “indovinare” i valori dellafunzione sperimentale nei punti compresi fra i nodi sperimentali usati per lacostruzione del polinomio.4 Solo per fare un esempio di interesse storico ematematico, le celebri tavole dei logaritmi con cui nei secolo scorsi generazionidi ingegneri hanno fatto i loro calcoli erano basate sull’interpolazione lineare.Più correttamente, le tavole riportavano una grande quantità di “nodi” (i cuilogaritmi erano calcolati con metodi che qui non possiamo approfondire). Sesi voleva calcolare il logaritmo di un numero che non appariva sulle tavole, losi localizzava fra i due nodi adiacenti, e si faceva l’interpolazione lineare fra diessi. Questo procedimento comportava un errore, tutto sommato trascurabilegrazie alla densità dei nodi. Ci auguriamo vivamente che il nostro studentenon si abbandoni a sorrisi di scherno verso i suoi “avi” scienziati. Se è veroche i moderni calcolatori sanno operare con precisione molto alta, anch’essiforniscono risposte approssimate. Facendo qualche confronto fra i risultatidel metodo delle tavole e quelli di una calcolatrice scientifica a dieci cifredecimali, ci si accorge che le tavole “sbagliano” mediamente dalla quinta cifrain poi. Un confronto decisamente lusinghiero, se si considera che le tavoleerano preparate calcolando con carta e matita!

Un altro uso possibile del polinomio interpolatore è quello di usarlo percalcolare l’integrale della funzione sperimentale incognita. Infatti, questointegrale potrebbe avere un significato concreto, e sarebbe pressoché impos-sibile stimarne il valore in altro modo. Su questo problema ritorneremo nellaprossima sezione. Più delicato e addirittura sconsigliabile se non come ultimotentativo è l’uso del polinomio per calcolare la derivata della funzione speri-mentale. La ragione di questo scetticismo dovrebbe essere chiaro. I graficidi due funzioni possono essere molto vicini nel piano cartesiano, ma averependenze molto diverse. Si pensi, intuitivamente, a una funzione costante ea una funzione che oscilla “furiosamente” fra due valori vicini alla costante.La prima ha pendenza identicamente nulla, la seconda ha pendenze molto

3D’accordo, stiamo facendo dell’ironia fuori luogo.4Si parla invece di estrapolazione quando si pretende di calcolare i valori esterni al più

piccolo e al più grande nodo sperimentale. Questo è un procedimento molto pericoloso.Se dati sperimentali molto fitti possono ragionevolmente indurre a un miglioramento del-l’interpolazione, nulla ci rassicura sul fatto che il polinomio approssimi bene la funzionesperimentale a grande distanza dai valori calcolati in laboratorio.

Page 185: lezioni di matematica

9.2. INTEGRAZIONE NUMERICA 177

brusche vicino alle oscillazioni. Poiché il nostro polinomio interpolatore ècostruito solo ed esclusivamente per assumere gli stessi valori della funzionesperimentale nei nodi calcolati, è difficile credere che serva ad approssimareaccuratamente la derivata. Anche per gli esperti, la derivazione numericaè un argomento tra i più difficili, e naturalmente non ce ne occuperemo inquesta sede.

Osservazione 9.2. Esistono altri tipi di approssimazione polinomiale, an-ch’essi molto diffusi nei problemi delle scienze applicate. Un primo esempioè quello di cercare un polinomio che passi per i nodi (xj, yj) e che in tailpunti abbia un assegnato valore della derivata prima. I polinomi che se nericavano5 prendono il nome di polinomi di Hermite. Pur senza soffermarcisulle loro proprietà, è evidente che a parità di nodi occorrono polinomi digrado più alto che per la semplice int erpolazione di Lagrange. Pensiamo aidue punti: sappiamo che per essi passa esattamente un polinomio di gradouno, ma il valore della derivata nei due nodi è fissato (e costante per i duepunti). Volendo prescrivere anche i due valori della derivata nei due nodi, ciserev un polinomio di grado maggiore. Ne deduciamo che l’interpolazione diHermite fornisce polinomi sensibilmente diversi da quelli di Lagrange.

Un altro esempio è quello della ricerca della retta che “meglio approssima”un insieme di punti del piano cartesiano. Abbiamo virgolettato la richiesta diapprossimazione perché non vogliamo entrare nei dettagli di questo metodo.È però evidente che non si pu ò parlare di interpolazione: se prendiamo trepunti non allineati nel piano cartesiano, non ci sarà nessuna retta di inter-polazione. Ha invece senso chiedersi quale sia (se esiste) la retta che passapiù vicino a tutti i punti segnati. Fra i metodi più popolari per trattarequesto problema è quello dei minimi quadrati. Facciamo un esempio nume-rico: prendiamo i tre punti di coordinate (−1, 0), (0, 0) e (1, 0), osservanoche appartengono alla parabola di equazione y = x2. Si calcola abbastanzavelocemente che la retta che passa più vicino a questi punti ha equazioney = 1/2. Siamo ben lontani dal concetto di interpolazione.

9.2 Integrazione numerica

Ci poniamo il problema di calcolare, con un’approssimazione prefissata, unintegrale definito ∫ b

a

f(x) dx,

5Lo studente rifletta sul fatto che non è affatto banale che tali polinomi esistano.

Page 186: lezioni di matematica

178 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

dove f è una funzione continua. Non è sempre possibile conoscere esplici-tamente una primitiva di f o, comunque, esprimere il valore dell’integralemediante una formula in cui compaiono solo funzioni elementari; anzi si puòdire che queste situazioni favorevoli devono ritenersi eccezionali. Presentere-mo tre metodi, tutti ispirati più o meno direttamente alla definizione stessadi integrale di Riemann.

8.2.1 Il metodo dei rettangoli

Fissato un intero n > 0, si ponga

xk = a+b− an

k (k = 0, 1, . . . , n)

e si assuma come valore approssimato dell’integrale

Sn =b− an

(f(x0) + f(x1) + · · ·+ f(xn−1)) .

Il seguente risultato esprime la precisione con cui Sn approssima il vero valoredell’integrale.

Teorema 9.3. Ammettendo che, per qualche costante M1 > 0 si abbia|f ′(x)| ≤M1 in [a, b] risulta∣∣∣∣Sn − ∫ b

a

f(x) dx

∣∣∣∣ ≤ M1

2

(b− a)2

n.

Quindi vediamo che limn→+∞ Sn =∫ baf(x) dx, e l’errore commesso tende

a zero come 1/n.

8.2.2 Il metodo delle tangenti

Il metodo precedente, come era da aspettarsi, è piuttosto grossolano.L’intuizione ci dice che, quando f sia abbastanza regolare, una somma deltipo

∑k(xk−xk−1)f(zk) fornisca una migliore approssimazione dell’integrale

se per ogni intervallo il punto zk coincide con il punto medio, cioè zk =(xk−1 + xk)/2. Sia dunque ancora

xk = a+b− an

k (k = 0, 1, . . . , n)

e siazk =

xk−1 + xk2

.

PoniamoS ′n =

b− an

(f(z1) + f(z2) + · · ·+ f(zn)) .

Page 187: lezioni di matematica

9.2. INTEGRAZIONE NUMERICA 179

Teorema 9.4. Sia f una funzione dotata di derivate prima e seconda con-tinue in [a, b] e si abbia |f ′′(x)| ≤M2. Allora∣∣∣∣S ′n − ∫ b

a

f(x) dx

∣∣∣∣ ≤ M2

24

(b− a)3

n2.

A parità di nodi, questo metodo fornisce effettivamente un’approssima-zione migliore.

Osservazione. Spesso si definisce uno stimatore della precisione numerica,chiamato ordine del metodo. Prendendo come funzioni–campione i solitipolinomi, un metodo numerico è di ordine N se esso è esatto (cioè non sicomemtte nessun errore) per tutti i polinomi di ordine (non superiore a) N .È facile convincersi che sia il metodo dei retatngoli che quelo dei trapezi sonodi ordine N = 1. Basta pensare alla costruzione delle approssimazion perrendersi conto che Sn e S ′n coincidono con il valore dell’integrale di f ognivolta che f è una funzione lineare. In questo senso, invitiamo lo studente adusare con la dovuta cautela il concetto di precisione per i metodi numerici.Potendosi dimostrare l’ottimalità delle stime fornite dai teoremi precedenti,deduciamo che l’ordine è uno stimatore che non si sovrappone alla velocitàcon cui l’errore tende a zero. D’altra parte, l’ordine non fa ricorso al numerodi derivate disponibili per la funzione integranda, e questo lo rende sensatoanche per le funzioni che siano solo continue. Avvertiamo che i tre metodiprecedenti sono esposti anche in [12], dove però le formule relative agli errorisono decisamente migliorabili. Una rapida ispezione delle stime mostra cheesse sono matematicamente rigorose, ma diverse da quelle dei nostri teoremiproprio in quanto è richiesta meno regolarità alla funzione integranda.

8.2.3 Il metodo di Cavalieri–Simpson

Il metodo delle tangenti consiste nel compiere l’integrazione dopo aversostituito, in ciascun intervallo della suddivisione, il grafico della funzionecon la tangente al grafico, in corrispondenza al punto di mezzo.

Viene spontaneamente l’idea di introdurre una curva che meglio appros-simi il grafico, almeno quando queto sia abbastanza “liscio”. Il metodo cheesponiamo consiste nell’approssimare il grafico con un arco di parabola, checoincida con la curva in corrispondenza degli estremi di ciascun intervallo edel punto di mezzo. 6

Presa dunque la suddivisione {x0, x1, . . . , xn} dell’intervallo [a, b] in n in-tervalli di uguale ampiezza, e posto zk = (xk−1 + xk)/2, consideriamo un

6Ricordiamo infatti che servono tre punti distinti per determinare univocamente unaparabola che li congiunga.

Page 188: lezioni di matematica

180 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

polinomio di secondo grado, che potrà essere scritto nella forma

pk(x) = α(x− zk)2 + β(x− zk) + γ,

e imponiamo le condizioni

pk(xk−1) = f(xk−1), pk(zk) = f(zk), pk(xk) = f(xk).

Ponendoxk − zk = zk − xk−1 = σ =

b− a2n

,

si avrà

γ = f(zk)

ασ2 + βσ = f(xk)− f(zk)

ασ2 − βσ = f(xk−1)− f(zk).

Si ha poi7∫ xk

xk−1

pk(x) dx =

(x− zk)3

3+ γ(x− zk)

]xkxk−1

=2

3ασ3 + 2γσ.

Ricavando α e γ dal sistema,∫ xk

xk−1

pk(x) dx =f(xk) + f(xk−1) + 4f(zk)

=b− an

f(xk) + f(xk−1) + 4f(zk)

6.

Sommando rispetto all’indice k, otteniamo la seguente espressione approssi-mata dell’integrale:

S?n =b− an

n∑k=1

f(xk) + f(xk−1) + 4f(zk)

6

=b− a6n

{f(x0) + f(xn) + 2

[f(x1) + f(x2) + · · ·+ f(xn−1)

]+ 4[f(z1) + f(z2) + · · ·+ f(zn)

]}.

Teorema 9.5. Sia f una funzione continua con le sue derivate fino al quartoordine in [a, b] e sia |D4f(x)| ≤M4. Allora∣∣∣∣S?n − ∫ b

a

f(x) dx

∣∣∣∣ ≤ M4(b− a)5

2880

1

n4.

7Il termine β2 (x−zk)2 si semplifica perché stiamo integrando su un intervallo simmetrico

rispetto a zk.

Page 189: lezioni di matematica

9.2. INTEGRAZIONE NUMERICA 181

Dalla costruzione emerge chiaramente che il metodo di Cavalieri–Simpsonè esatto per i polinomi di secondo grado, e dunque è un metodo di ordineN = 2.

Osservazione 9.6. Avvertiamo lo studente che su molti testi vengono utiliz-zate notazioni diverse. Noi abbiamo introdotto, per ogni coppia di nodi xk exk+1 un noto di comodo zk. Altri autori prendono invece tre nodi consecutivixk−1, xk e xk+1 della suddivisione, considerando ovviamente xk alla streguadel nostro zk. A questo punto però bisogna scegliere obbligatoriamente npari, altrimenti non si riesce ad arrivare a b con l’ultimo passaggio. È chiaroche l’idea resta sempre quella di approssimare f mediante archi di parabola.

Concludiamo con un confronto: cerchiamo di approssimare

log 2 =

∫ 2

1

dx

x.

Prendendo n = 4 nel metodo delle tangenti, i punti di mezzo saranno

9

8,11

8,13

8,15

8.

Troviamo dunque

S ′4 =1

4

(8

9+

8

11+

8

13+

8

15

)= 0.6910

mentre log 2 = 0.6931... Con 4 suddivisioni, il valore è corretto alla secondacifra decimale.

Usiamo invece il metodo di Cavalieri–Simpson con n = 2. facendo qualchecalcolo si arriva a

S?2 =1

12

(1 +

1

2+

4

3+ 4

(4

5+

4

7

))= 0.6932...

Come si vede, l’approssimazione ottenuta è sensibilmente migliore già con lametà di suddivisioni.8

Il contenuto di questo paragrafo è preso dall’ultimo capitolo di [22]. Nontrattandosi di un testo specializzato nel calcolo numerico, la trattazione haun’impostazione molto geometrica ed intuitiva. In effetti, dubitiamo chelo studente abbia scorto il legame fra i tre metodi proposti e l’interpola-zione polinomiale. Per il metodo dei rettangoli, tale legame semplicemen-te non c’è, o comunque è decisamente “degenere”. Infatti ci siamo limitati

8A questo riguardo, si leggano gli ultimi capoversi del capitolo.

Page 190: lezioni di matematica

182 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

ad approssimare la funzione continua f con segmenti orizzontali, ottenendoun’approssimazione chiaramente discontinua.

In realtà, il metodo di Cavalieri–Simpson consiste evidentemente nell’in-tegrazione di un polinomio interpolatore di secondo grado, come abbiamoevidenziato nella costruzione. Come utile esercizio, lo studente potrà veri-ficare che partendo dal polinomio interpolatore di Lagrange passante per itre punti (xk, f(xk)), (zk, f(zk), (xk+1, f(xk+1)) e integrandolo fra xk e xk+1

si perviene alla stessa formula. Non abbiamo seguito questa via solo perchéconveniva sfruttare la simmetria rispetto al punto mediano zk per semplificarealcuni calcoli.

Resta da capire se l’integrazione del polinomio interpolatore di primogrado conduca a una formula di integrazione approssimata efficiente. Larisposta è affermativa, e il metodo va sotto il nome di metodo dei trapezi.

Fissata la solita suddivisione {x0, x1, . . . , xn} di [a, b], per ogni intervallino[xk−1, xk] possiamo introdurre il polinomio di interpolazione lineare p1, cheesplicitamente si scrive

p1(x) =f(xk)− f(xk−1)

xk − xk−1

(x− xk−1) + f(xk−1).

Integrando, 9∫ xk

xk−1

p1(x) dx =f(xk) + f(xk−1)

2(xk − xk−1) =

b− an

f(xk) + f(xk−1)

2.

Infine, sommando rispetto all’indice k, troviamo la formula di approssima-zione per l’integrale esteso da a a b:

Strapn =

b− an

n∑k=1

f(xk) + f(xk−1)

2.

Per costruzione, questo è un metodo di ordine N = 1, dato che i polinomiper i quali l’interpolazione lineare è sempre esatta sono quelli di grado uno.

È altresì evidente che nulla ci impedisce di considerare polinomi inter-polatori di grado più alto di due. Potremmo infatti raggruppare i punti atre a tre e cercare un polinomio di terzo grado che li unisca.10 Se questopuò sembrare un gioco appassionante con cui mettere alla prova la propria

9Lo studente si convinca che l’integrale di p1 altro non è che l’area di un trapeziorettangolo di basi f(xk) e f(xk−1) e altezza (b− a)/n.

10Evidentemente, capiterà di dover supporre che il numero di intervalli della suddivisionesia pari. Questo dettaglio sarà sottinteso.

Page 191: lezioni di matematica

9.2. INTEGRAZIONE NUMERICA 183

comprensione dell’argomento, ci si accorge in fretta che esagerare non servea molto. Lo studente avrà senz’altro notato che far passare un polinomio didecimo grado per undici nodi è solo una complicazione tecnica: tanto vale“raffinare” la suddivisione dell’intervallo e usare un polinomio di grado infe-riore. La formula di Cavalieri–Simpson è una delle preferibili, dal momentoche unisce accuratezza e semplicità. Nella letteratura specializzata (si ve-da [23]), molta importanza viene data ai metodi di Newton–Cotes, basatiproprio sui polinomi di Lagrange.

Infine, tutti i metodi di integrazione approssimata hanno la caratteristicadi essere facilmente implementabili in un qualsiasi linguaggio di programma-zione moderno, come il C, il Python, il Fortran o anche uno dei linguaggi dialto livello come Matlab, Mathematica o Maple. Per tutti si tratta solamentedi ricevere in input una stringa di dati (i nodi sulle ascisse e i corrispondentivalori sulle ordinate) e di emettere in output un numero ottenuto mediantealcune semplici operazioni aritmetiche.

Lo studente interessato potrà trovare alcuni esempi, assolutamente ele-mentari e primitivi, di implementazione nel linguaggio C dei metodi deitrapezi, delle tangenti e di Simpson sul sito dell’autore, nella sezione di di-dattica. La scelta del linguaggio C è legata all’esistenza dei compilatoreOpen Source gcc, liberamente installabile su ogni sistema operativo moder-no e già presente nelle principali distribuzioni GNU/Linux. Naturalmente ilcodice è così semplice da poter essere tradotto in tutti i linguaggi scientificiconosciuti. Solo per comodità, riportiamo di seguito il brevissimo listato delmetodo dei trapezi in Python. La prima riga è specifica per i sistemi Unix(GNU/Linux, *BSD, Apple Mac OS X, ecc.)

#!/usr/bin/python

def f(x) :t = 1./xreturn t

n = 1000i = 0x1 = 1.x2 = 1. + 1./nS = 0.

while i<n :x1 = x2x2 = x2 + 1./nS = S + (1./n)*0.5*(f(x1)+f(x2))i = i+1

Page 192: lezioni di matematica

184 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

print S

Lo studente noterà che abbiamo evitato l’uso degli array per memorizzarei nodi della suddivisione e le corrispondenti immagini. Un informatico note-rebbe che il listato in Python è preferibile a quelli in C proprio perché usastrutture più elementari. Per un matematico, al contrario, è più spontaneousare un array di numeri reali.

Page 193: lezioni di matematica

Epilogo

Siamo arrivati alla fine del nostro viaggio, durato circa dodici settimane eaccompagnato probabilmente da prove scritte intermedie. Lo studio di questedispense, affiancate dagli appunti del corso e delle esercitazioni, e soprattuttocompletato dalla lettura di uno dei testi segnalati nella bibliografia, dovrebbetrasmettere allo studente le conoscenze indspensabili a qualsiasi laureando inuna disciplina scientifica. Sono sicuro che solo un numero statisticamentetrascurabile di iscritti serberà un ricordo piacevole del corso di Matematica.Resta tuttavia la speranza che, almeno una volta, le idee studiate con faticain questi mesi possano rivelarsi utili.

A tutti gli studenti che sono arrivati alla fine delle lezioni senza com-mettere gesti insani, va un ringraziamento e l’invito a proseguire la carrierauniversitaria con serietà e passione.

185

Page 194: lezioni di matematica

186 EPILOGO

Page 195: lezioni di matematica

Commento alla bibliografia

Innanzitutto, suggeriamo senz’altro a tutti gli studenti di leggere il classicotesto di Courant e Robbins [7]. Ne esiste una traduzione italiana risalente aglianni ’70 del secolo scorso. È una descrizione molto piacevole e scorrevole deifondamenti della matematica moderna, spesso presentati attraverso esempie problemi di facile comprensione. Non è però un valido libro di testo per uncorso universitario.

Il fatto che il libro di G.H. Hardy [16] risalga al 1921 (ed era già la terzaristampa!) dovrebbe essere un chiaro segnale della classicità degli argomentitrattati nel nostro corso. A parte qualche notazione ormai caduta in disuso, iltesto di Hardy conserva ancora oggi un notevole fascino scientifico, e potrebbetranquillamente essere utilizzato nelle nostre università.

Un manuale molto recente, che lo studente può trovare interessante ededucativo, è [5]. Lo stile del libro è veloce e preciso, e l’unica differenza fra ilsuo contenuto e le lezioni in aula è la costruzione dell’integrale di Riemann.In questo libro è stata privilegiata la definizione più intuitiva dell’integraledefinito mediante il limite delle somme integrali. Come dimostriamo nelTeorema 6.10, di fatto la nostra costruzione coincide con quella di [5], ma sirivela più maneggevole nelle dimostrazioni.

Un altro testo di riferimento per il corso è [6]: un libro moderno e riccodi contenuti, approfondimenti ed esercizi svolti. Alcuni argomenti vengonoperò trattati da un punto di vista diverso, e presuppone nel lettore unapreparazione che, di questi tempi, non sembra essere molto diffusa.

Proprio quest’anno è uscito il manuale [13] che propone per intero gliargomenti trattati nel nostro corso (con un capitolo di ripasso della geometriaanalitica, utile per rivedere o apprendere qualche concetto utilizzato ancheda noi). Il ritmo dell’esposizione è molto tranquillo, e numerosi sono gliesempi e i commenti ai contenuti. La lunga esperienza didattica ha suggeritoall’Autore l’omissione di alcune dimostrazioni particolarmente tecniche; inquesti rari casi, lo studente troverà i dettagli sulle dispense.

Più simile alle nostre dispense è invece [11], strutturato in capitoli snellie adatti ad essere trattati in due ore circa di lezione. Le successioni sono

187

Page 196: lezioni di matematica

188 EPILOGO

introdotte soltanto alla fine, come capitolo facoltativo. Questo rende alcunedimostrazioni meno trasparenti ed intuitive, e gli esercizi sono di un livellosenz’altro superiore a quelli che il nostro studente deve saper risolvere. Iltesto [22], scritto da o dei padri della moderna Analisi non lineare, è sta-to considerato a lungo uno dei migliori manuali universitari per lo studiodell’Analisi Matematica, prevalentemente rivolto a studenti del corso di Ma-tematica o Fisica. Così come per [24], non ci sentiamo di consigliarli al nostrolettore: appaiono qui solo perché, sporadicamente, ne abbiamo tratto spuntie osservazioni interessanti.

Il libro [4] è probabilmente il miglior testo per lo studio astratto delleproprietà infinitesimali delle funzioni. Il livello della presentazione è estre-mamente elevato. Per quanto riguarda gli argomenti numerici, consigliamosenz’altro [18, 23].

Qualche studente si chiederà se l’ordine dei nostri capitoli corrispondefedelmente allo sviluppo storico del calcolo infinitesimale. In realtà, la mate-matica si è sviluppata gradualmente, e spesso i grandi matematici che hannosviluppato le idee esposte in queste dispense non scrivevano delle definizionirigorose e pulite come quelle a cui ci siamo abituati. Il libro di Hairer [15] èun’affascinante confronto fra lo sviluppo storico del calcolo e quello pedago-gico dei nostri giorni. Un fatto da tenere a mente è stata la “rivoluzione bour-bakista” degli anni ’50 e ’60 del secolo appena trascorso. Partendo dalla Fran-cia, si è diffusa la richiesta di un ripensamento nitido e logicamente rigorosodelle discipline che compongono la matematica contemporanea. Il gruppoBourbaki cercò di esporre tutta la matematica moderna in modo puramentelogico–deduttivo. Questo approccio è stato molto criticato, e la principaleaccusa era di nascondere la natura dell’atto creativo in matematica.

Infine, un testo apparso di recente è [21]. Gli argomenti trattati spazianodai numeri reali al calcolo integrale in più dimensioni. Sembra chiaramenteispirato allo stile di [24], ma con qualche attenzione in più agil esempi e allenecessità didattiche attuali. Gli esercizi non sono tutti originali, ed il lorolivello è decisamente avanzato.

Page 197: lezioni di matematica

Indice

1 Insiemi e Funzioni 11.1 Cenni di logica elementare . . . . . . . . . . . . . . . . . . . . 11.2 Richiami di insiemistica . . . . . . . . . . . . . . . . . . . . . 41.3 Insiemi numerici . . . . . . . . . . . . . . . . . . . . . . . . . . 61.4 Topologia della retta reale . . . . . . . . . . . . . . . . . . . . 101.5 L’infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.6 Punti di accumulazione . . . . . . . . . . . . . . . . . . . . . . 151.7 Appendice: la dimostrazione per induzione . . . . . . . . . . . 16

2 Funzioni fra insiemi 192.1 Operazioni sulle funzioni . . . . . . . . . . . . . . . . . . . . . 252.2 Funzioni monotòne e funzioni periodiche . . . . . . . . . . . . 282.3 Grafici cartesiani . . . . . . . . . . . . . . . . . . . . . . . . . 292.4 Funzioni elementari . . . . . . . . . . . . . . . . . . . . . . . . 30

3 Successioni di numeri reali 333.1 Successioni e loro limiti . . . . . . . . . . . . . . . . . . . . . . 333.2 Proprietà asintotiche delle successioni . . . . . . . . . . . . . . 403.3 Infinitesimi ed infiniti equivalenti . . . . . . . . . . . . . . . . 433.4 Sottosuccessioni . . . . . . . . . . . . . . . . . . . . . . . . . . 443.5 Il numero e di Nepero . . . . . . . . . . . . . . . . . . . . . . 453.6 Appendice: successioni di Cauchy . . . . . . . . . . . . . . . . 47

4 Serie numeriche 494.1 Serie a termini positivi . . . . . . . . . . . . . . . . . . . . . . 544.2 Criteri di convergenza . . . . . . . . . . . . . . . . . . . . . . 564.3 Convergenza assoluta e convergenza delle serie di segno alterno 60

5 Limiti di funzioni e funzioni continue 635.1 Limiti di funzioni come limiti di successioni . . . . . . . . . . . 635.2 Traduzione dei teoremi sulle successioni . . . . . . . . . . . . . 67

189

Page 198: lezioni di matematica

190 INDICE

5.3 Raccolta di limiti notevoli . . . . . . . . . . . . . . . . . . . . 685.4 Continuità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705.5 Infinitesimi ed infiniti equivalenti . . . . . . . . . . . . . . . . 735.6 Teoremi fondamentali per le funzioni continue . . . . . . . . . 755.7 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . 785.8 Punti di discontinuità . . . . . . . . . . . . . . . . . . . . . . . 82

6 Il calcolo differenziale 856.1 Variazioni infinitesime . . . . . . . . . . . . . . . . . . . . . . 856.2 Il calcolo delle derivate . . . . . . . . . . . . . . . . . . . . . . 896.3 I teoremi fondamentali del calcolo differenziale . . . . . . . . . 936.4 Punti singolari . . . . . . . . . . . . . . . . . . . . . . . . . . . 986.5 Applicazioni allo studio delle funzioni . . . . . . . . . . . . . . 996.6 Derivate successive . . . . . . . . . . . . . . . . . . . . . . . . 1016.7 Classi di regolarità . . . . . . . . . . . . . . . . . . . . . . . . 1056.8 Grafici di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . 1066.9 Il teorema di De l’Hospital . . . . . . . . . . . . . . . . . . . . 1086.10 Il polinomio di Taylor . . . . . . . . . . . . . . . . . . . . . . . 112

7 Integrale di Riemann 1217.1 Partizioni del dominio . . . . . . . . . . . . . . . . . . . . . . 1227.2 Continuità uniforme . . . . . . . . . . . . . . . . . . . . . . . 1307.3 Teorema fondamentale del calcolo . . . . . . . . . . . . . . . . 1347.4 Media integrale . . . . . . . . . . . . . . . . . . . . . . . . . . 1387.5 Applicazioni al calcolo degli integrali definiti . . . . . . . . . . 1387.6 Cenni sulla ricerca delle primitive . . . . . . . . . . . . . . . . 1407.7 Il differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . 1437.8 Integrazione delle funzioni razionali fratte . . . . . . . . . . . . 1457.9 Il polinomio di Taylor con resto integrale . . . . . . . . . . . . 1507.10 Integrali impropri . . . . . . . . . . . . . . . . . . . . . . . . . 152

7.10.1 Funzioni illimitate . . . . . . . . . . . . . . . . . . . . 1527.10.2 Funzioni definite su intervalli illimitati . . . . . . . . . 154

8 Equazioni differenziali ordinarie 1578.1 Equazioni differenziali lineari del primo ordine . . . . . . . . . 1588.2 Equazioni del primo ordine a variabili separabili . . . . . . . . 1618.3 Equazioni lineari del secondo ordine . . . . . . . . . . . . . . . 167

9 Metodi del calcolo approssimato 1739.1 Interpolazione polinomiale . . . . . . . . . . . . . . . . . . . . 1739.2 Integrazione numerica . . . . . . . . . . . . . . . . . . . . . . 177

Page 199: lezioni di matematica

INDICE 191

Epilogo 185

Page 200: lezioni di matematica

192 INDICE

Page 201: lezioni di matematica

Bibliografia

[1] M. Abate. Geometria. McGraw–Hill.

[2] M. Abramowitz and I. A. Stegun. Handbook of mathematical functions.National Bureau of Standards, 1972.

[3] G. Birkhoff and S. MacLane. A survey of modern algebra. MacMillan,1977.

[4] N. Bourbaki. Éléments de Mathématiques. Fonctions d’une variableréelle. Springer–Verlag.

[5] M. Bramanti, C. Pagani, S. Salsa. Analisi matematica 1. Zanichelli,2008.

[6] M. Conti, D. L. Ferrario, S. Terracini, and G. Verzini. AnalisiMatematica. Apogeo, 2006.

[7] R. Courant, H. Robbins. What is mathematics? Oxford UniversityPress, 1996.

[8] N. Fusco, P. Marcellini, and C. Sbordone. Analisi Matematica Due.Liguori.

[9] G. De Marco. Analisi Due. Zanichelli.

[10] G. De Marco. Analisi Uno. Zanichelli.

[11] M. Giaquinta and G. Modica. Analisi Matematica. 1. Funzioni di unavariabile. Pitagora Editrice.

[12] M. Giaquinta and G. Modica. Analisi Matematica. 2. Approssimazionee Processi Discreti. Pitagora Editrice.

[13] E. Giusti. Elementi di analisi matematica. Bollati Boringhieri.

[14] E. Hairer. Analysis by its history. Springer–Verlag.

193

Page 202: lezioni di matematica

194 BIBLIOGRAFIA

[15] P. Halmos. Naïve set theory. Van Nostrand.

[16] G. H. Hardy. A course of pure mathematics. Cambridge UniversityPress, 1921.

[17] J. Heading. Equazioni differenziali ordinarie. Liguori.

[18] F. Jedrzejewski. Introduction aux méthodes numeriques. Springer, 2005.

[19] J. Kelley. General topology. Springer.

[20] E. Mendelson. Introduction to mathematical logic. Chapman & Hall,1997.

[21] M. Mureşan. A concrete approach to classical analysis. Springer–Verlag.

[22] G. Prodi. Analisi matematica. Bollati Boringhieri, 1970.

[23] A. Quarteroni, R. Sacco, and F. Saleri. Matematica Numerica. Springer.

[24] W. Rudin. Principi di analisi matematica. McGraw–Hill, 1991.

[25] E. Stein, R. Shakarchi. Fourier analysis, an introduction. PrincetonUniversity Press.