Recursivitat
Aquesta lliçó introdueix la tècnica de la recursivitat, on una funció o una acció realitza una tasca repetitiva tot invocant-se a sí mateixa, sense necessitat d'utilitzar bucles. La recursivitat és una tècnica molt potent que es basa en reduir un problema complex en un o més problemes del mateix tipus, però més senzills. Al llarg del curs s'anirà comprovant el seu poder, aquest lliçó només en presenta una breu introducció amb exemples de complexitat creixent.
Factorial recursiu
Recordeu que el factorial d'un nombre
Ja havíem escrit una funció iterativa que calcula el factorial d'un nombre donat. Era quelcom així:
def factorial_iteratiu(n: int) -> int:
"""Retorna el factorial d'un natural n."""
f = 1
for i in range(2, n + 1):
f = f * i
return f
Anem a explorar una altra manera de fer-ho: amb recursivitat!
Comencem primer per les matemàtiques:
Ja sabem que el factorial de 0 és 1:
Si tenim un nombre natural
, també tenim la propietat següent: La raó és que
.
En definitiva, hem establert que
Aquest tipus d'identitat s'anomena recurrència, ja que defineix cada terme de la seqüència en funció de termes anteriors. La recurrència està ben definida perquè el primer valor (
El nostre objectiu és definir una funció, diguem-ne factorial
, que, donat un natural n
, retorni el factorial de n
:
def factorial(n: int) -> int:
"""Retorna el factorial d'un natural n."""
...
Per programar el cos d'aquesta funció, utilitzem la recurrència que hem obtingut anteriorment. Primer, establim el cas base:
def factorial(n: int) -> int:
"""Retorna el factorial d'un natural n."""
if n == 0:
return 1
...
Comença bé! Quan
I si no és el cas base? Doncs llavors hi afegim el cas recursiu:
def factorial(n: int) -> int:
"""Retorna el factorial d'un natural n."""
if n == 0:
return 1
else:
return factorial(n - 1) * n
És clar, la recurrència ens diu que quan el natural factorial
sobre el paràmetre factorial(n - 1)
perquè justament l'especificació de factorial
diu que ens retorna el factorial del natural que se li passa com a paràmetre. I, quan
Algú pot creure que la funció factorial
no pot invocar la pròpia funció factorial
però... perquè no? No hi ha cap raó que ho prohibeixi. De fet, quan tenim una funció que es crida a ella mateixa, diem que tenim una funció recursiva i la tècnica de la recursivat consisteix justament en escriure funcions o accions recursives. En aquest cas hem obtingut una solució recursiva per calcular el factorial. Aquest exemple mostra que els bucles no són estrictament necessaris: podem descriure repeticions amb recursivitat.
Escriptura recursiva
Suposeu que voleu escriure n
cops seguits el caràcter c
amb una acció escriure(n: int, c: str)
. Per exemple, escriure(8, 'o');
hauria d'escriure oooooooo.
Segur que sabeu implementar l'acció escriu
iterativament (amb un bucle while
o un bucle for
), i segur que també sabeu fer-ho amb c * n
, però ara serà instructiu implementar-la recursivament.
Comencem especificant la nostra acció:
def escriure(n: int, c: char) -> None:
"""Escriu n ≥ 0 cops seguits c."""
Quan volem fer recursivitat ens cal sempre pensar en dos casos:
El cas base: En el cas d'
escriure
, el cas base és quann
és tant simple que la solució és directa. Aquest cas és quann == 0
: en aquest cas no cal fer res de res!El cas recursiu: El cas recursiu és doncs quan
n > 0
, és a dir, quan cal escriure un caràcter com a mínim. Ara, ens cal pensar com podem escriuren > 0
caràcters recursivament. Una primera manera de fer-ho, seria escriure una primer caràcter i, després, escriure elsn - 1
restants. Com quen > 0
,n - 1 ≥ 0
i, per tant, aquestsn - 1
caràctersc
es poden escriure cridant aescriure(n - 1, c)
, és a dir, fent una crida recursiva.
Això dóna lloc a la implementació següent:
def escriure(n: int, c: char) { -> None:
"""Escriu n ≥ 0 cops seguits c."""
if n > 0:
print(c, end='') # escriu un cop el caràcter c
escriure(n - 1, c); # escriu n - 1 cops el caràcter c
Una segona manera de tractar el cas recursiu seria primer escriure recursivament n - 1
cops el caràcter c
i, després, escriure un cop el caràcter c
:
def escriure(n: int, c: char) { -> None:
"""Escriu n ≥ 0 cops seguits c."""
if n > 0:
escriure(n - 1, c); # escriu n - 1 cops el caràcter c
print(c, end='') # escriu un cop el caràcter c
La solució és diferent però la funcionalitat (el què fa) és la mateixa.
Hi ha més maneres d'escriure recursivament aquesta funció. La nostra tercera solució es basarà en el fet que, per escriure n
cops c
, també podem escriure primer la meitat dels n
caràcters recursivament i escriure després la meitat dels n
caràcters recursivament. Però cal anar en compte amb la paritat de n
:
Si
n
és parell, podem escriuren
cops el caràcterc
cridant dos cops a escriuren // 2
cops el caràcterc
recursivament.Si
n
és senar, podem escriuren
cops el caràcterc
cridant dos cops a escriuren // 2
cops el caràcterc
recursivament i escrivint addicionalment un cop el caràcterc
(perquè a causa de la divisió entera entre 2, a la primera crida se'n perd "mig" i la segona "mig" més).
Aquesta idea dóna lloc en aquesta nova implementació:
def escriure(n: int, c: char) -> None:
"""Escriu n ≥ 0 cops seguits c."""
if n > 0:
if n % 2 == 0:
escriure(n // 2, c)
escriure(n // 2, c)
else:
escriure(n // 2, c)
print(c, end='')
escriure(n // 2, c);
que podem compactar així:
def escriure(n: int, c: char) -> None:
"""Escriu n ≥ 0 cops seguits c."""
if n > 0:
escriure(n // 2, c)
if n % 2 != 0:
print(c, end='')
escriure(n // 2, c);
De fet, la escriptura condicional de c
es pot fer abans de la primera crida recursiva, entre la primera crida i la segona recursiva (com s'ha fet), o després de la segona crida recursiva. Tant és.
Màxim comú divisor recursiu
Recordeu que, donats dos nombres naturals
def mcd_iteratiu(x: int, y: int) -> int:
"""Retorna el màxim comú divisor de dos enters x i y, amb x ≥ 0 i y ≥ 0."""
while y != 0:
x, y = y, x % y
return x
La solució recursiva simplement substitueix la iteració per crida recursiva:
def mcd_recursiu(x: int, y: int) -> int:
"""Retorna el màxim comú divisor de dos enters x i y, amb x ≥ 0 i y ≥ 0."""
if y != 0:
return mcd_recursiu(y, x % y)
else:
return x
Nombres de Fibonacci
La seqüència de Fibonacci es defineix de la forma següent:
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, ...
És a dir, cada element és la suma dels dos anteriors. En termes matemàtics, la seqüència de Fibonacci es troba definida per la recurrència següent:
Aquesta seqüència se li va acudir a Leonardo de Pisa Fibonacci (1175-1250) quan estudiava els patrons reproductius dels conills i apareix sovint a la natura. Per exemple, els gira-sols tenen 21 espirals de pipes en un sentit i 34 en l’altre, i ambdós són nombres consecutius de Fibonacci. També, la majoria de plantes tenen un nombre de pètals que és un nombre de Fibonacci.
Independentment d'això, voldríem una funció que calculés l'n
-èsim nombre de Fibonacci. Com que som al tema de recursivitat i som valents, provarem d'implementar la recurrència en Python, cosa que no ens hauria de costar gens:
def fibonacci(n: int) -> int:
"""Donat un natural n, retorna l'n-èsim nombre de Fibonacci."""
if n <= 1:
return n
else:
return fibonacci(n - 1) + fibonacci(n - 2)
Realment, la funció no és altra cosa que una transcripció a Python de la recurrència matemàtica. Això ens dóna la seguretat de que la funció és correcta. Ara bé, aquesta implementació té un greu problema d'eficiència ja que recalcula molts càlculs que ja ha calculat prèviament. El meu ordinador triga uns 5 segons en calcular fibonacci(36)
, no gaure brillant!
Per tal d'obtenir una solució recursiva més eficient, podem pensar en crear una funció recursiva que, donat un natural
def fibonacci_aux(n: int) -> tuple[int, int]:
"""
Donat un natural n, retorna (F(n), F(n-1)).
Quan n = 0, retorna (0, 0).
"""
La seva implementació és la següent:
def fibonacci_aux(n: int) -> tuple[int, int]:
"""
Donat un natural n, retorna (F(n), F(n-1)).
Quan n = 0, retorna (0, 0).
"""
if n == 0:
return 0, 0
elif n == 1:
return 1, 0
else:
penultim, antepenultim = fibonacci_aux(n - 1)
return penultim + antepenultim, penultim
Altrament dit:
Quan
n
val 0, l'especificació ja diu que hem de retornar (0,0). El primer 0 és clar, perquè representa, el segón és irrelevant, perquè representa que no està definit. Quan
n
val 1, cal retornar (1, 0) que és (, ). Quan
n
no és 0 ni 1, la funciófibonacci_aux
crida afibonacci_aux
ambn - 1
per obtenir (, . El primer el desa en penultim
i el segon enantepenultim
. Després, es retorna (, a través de penultim + antepenultim, penultim
.
Evidentment, el nostre propòsit original era escriure una funció que calculés l'n
-èsim nombre de Fibonacci, no aquesta acció auxiliar. Però ara ja podem definir fàcilment la funció fibonacci
posant en marxa l'acció auxiliar recursiva i quedant-nos només amb el primer nombre del parell obtingut:
def fibonacci(n: int) -> int:
"""Donat un natural n, retorna l'n-èsim nombre de Fibonacci."""
return fibonacci_aux(n)[0]
Si ara mesureu quan triga fibonacci(36)
al vostre ordinador veureu que aquesta versió és immensament més ràpida que l'anterior.
Escriure un nombre en una base
Considerem ara que volem escriure un nombre n
en una determinada base b
. Suposarem que b
es troba entre 2 i 10, perquè bases inferiors a 2 no tenen massa sentit i perquè les bases a partir de 10 necessiten més digits. Per exemple, escriure 9 en base 2 hauria de donar 1001
i escriure 30 en base 4 hauria de donar ´132´.
Aquesta seria la capçalera i especificació de l'acció que ho ha de dur a terme:
def escriure_base(n: int, b: int) -> None:
"""Escriu n en base b. Prec: n ≥ 0 i 2 ≤ b ≤ 10."""
La manera de fer el canvi de base és anar dividint el nombre per la base i escriure el seu darrer digit.
!!! Dibuix
Ara bé, aquest procés iteratiu dóna el resultat en ordre invers!
Podem utilitzar la recursivitat per donar el resultat del dret:
El cas base serà quan
n
ja només tingui un dígit en baseb
: Només cal escriuren
.El cas recursiu escriu primer el nombre
n // b
en baseb
amb una crida recursiva i, després, escriu el darrer dígit den
en baseb
.
La implementació queda doncs així:
def escriure_base(n: int, b: int) -> None:
"""Escriu n en base b. Prec: n ≥ 0 i 2 ≤ b ≤ 10."""
if n < b:
print(n, end='')
else:
escriure_base(n // b, b)
print(n % b, end='')
Els end=''
dins del print
s són per no posar un salt de línia.
Observeu que és convenient usar un sol dígit com a cas base enlloc del zero com a cas base i no escriure a res. Altrament caldria tractar de forma especial l'escriptura del número zero.
Exercici: Què passaria si es canviés l'ordre de les línies dins l'else
?
Recursivitat i inducció matemàtica
La tècnica de la recursivitat està directament relacionada amb la inducció matemàtica. Les demostracions per inducció permeten demostrar que una propietat és vàlida per a tots els possibles nombres naturals només demostrant dos fets:
- Que la propietat és certa per al nombre 0 (cas base).
- Que quan la propietat és certa pel natural
també és certa per a (cas inductiu).
Per exemple, podem demostrar que
Cas base: Quan
, tenim que i que . Per tant, la propietat és certa per a . Cas inductiu: Considerem un natural qualsevol
. Agafem com a hipòtesi d'inducció que . Voldríem veure doncs que
. I, en efecte,
. Les claus inferiors senyalen el punt on s'ha aplicat la hipòtesi d'inducció.
De la mateixa manera, podem demostrar que la funció recursiva factorial
funciona correctament per a tota entrada natural n
. Recordeu la seva definició:
def factorial(n: int) -> int:
if n == 0:
return 1
else:
return factorial(n - 1) * n
Demostrem-ho:
Cas base: Quan
, és clar que factorial(0)
retorna 1, perquè la condició delif
és certa. Per tant, la funciófactorial
funciona correctament perja que retorna 1, que és el factorial de 0. Cas inductiu: Considerem un natural qualsevol
. Agafem com a hipòtesi d'inducció que la funció factorial
funciona correctament per aquest. Volem doncs veure que la funció
factorial
també funciona correctament per. I, en efecte, com que
és un natural, la invocació de factorial(n + 1)
serà amb un valor deque no és zero. Per tant, la funció anirà per l' else
i retornaràfactorial(n) * (n + 1)
. Com que, per hipòtesi d'inducció, la funciófactorial
funciona correctament pern
, la invocació defactorial(n)
retornarà. I, per tant, la invocació de factorial(n + 1)
retornarà, és a dir, . Per tant, la funció factorial
funciona correctament per.
El principi d'inducció ens permet doncs concloure que la funció factorial
funciona correctament per a tota la infinitat de naturals.
Jordi Petit, Salvador Roura
Lliçons.jutge.org
© Universitat Politècnica de Catalunya, 2024