CHAPTER 5: RESULTS AND DISCUSSION: MODEL OF DOMAIN LEARNING
6.5 Implications
Consideremos la afirmaci´on siguiente:
Principio de elecciones dependientes (ED) Para todo conjunto A 6= ∅ y
toda relaci´on R ⊂ A × A tal que Va ∈ AWb ∈ A b R a, existe f : ω −→ A tal queVn ∈ ω f(n + 1) R f(n).
Y consideremos la siguiente “demostraci´on”:
Como A no es vac´ıo, podemos tomar x0∈ A. Por hip´otesis existe un
x1 ∈ A tal que x1R x0, por el mismo motivo, existe un x2 ∈ A tal que x2R x1. Como este proceso puede prolongarse indefinidamente, concluimos que existe una sucesi´on {xn}n∈ω de elementos de A tal que Vn ∈ ω xn+1R xn, pero tal sucesi´on no es sino una funci´on
f : ω −→ A que cumple lo requerido.
Cualquier matem´atico dar´ıa esto por bueno, pero, si pretende ser una de- mostraci´on a partir de los axiomas que hemos considerado hasta ahora, lo cierto es que no lo es. La existencia de la sucesi´on {xn}n∈ω no puede ser demostrada a partir del hecho de que R no est´a bien fundada en A (no si tomamos como ´
unica base admisible los axiomas que estamos considerando).
Para entender cu´al es el fallo, observemos que lo que se pretende es afirmar la existencia de una cierta funci´on f : ω −→ A, una funci´on con la propiedad de queVn ∈ ω f(n + 1) R f(n), pero ¿cu´al es esa funci´on? ¿c´omo y cu´ando hemos
probado su existencia?
Lo que hemos probado es que existe una funci´on s1 : 2 −→ A tal que
s1(1) ∈ s1(0), y luego hemos probado que puede extenderse hasta una funci´on
s2 : 3 −→ A tal que s2(2) ∈ s2(1) ∈ s2(0), y de ah´ı hemos pasado a afirmar directamente la existencia de f sin m´as explicaciones. ¿Es posible justificar ese ´
ultimo paso?
Obviamente, ning´un matem´atico aceptar´a que porque algo se cumpla para 0, 1, 2 (en nuestro contexto, trivialmente para 0), se vaya a cumplir en general, pero no es extra˜no que los matem´aticos den saltos as´ı cuando son justificables por argumentos inductivos. Ahora bien, en nuestro caso, si continuamos el argumento por inducci´on, lo que podemos demostrar sin dificultad es que
V
nWs(s : n + 1 −→ A ∧Vi < n s(i + 1) R s(i)).
Hasta aqu´ı todo es correcto, pero ¿c´omo se obtiene la existencia de f a partir de aqu´ı?
Un matem´atico podr´ıa decir: “para cada n ∈ ω, tomemos sn : n + 1 −→ A en las condiciones indicadas”. Eso es admisible en la pr´actica habitual del matem´atico, pero no es una consecuencia l´ogica de los axiomas que hemos visto hasta el momento. Una cosa es que, fijado un n, la l´ogica nos dice que podemos eliminar los cuantificadores y considerar un s que cumpla lo indicado, e incluso que podemos llamarlo snsi preferimos llamarlo as´ı, pero otra cosa muy distinta, y que est´a impl´ıcita en lo que entiende el matem´atico al “tomar sn”, es afirmar la existencia de una funci´on s que a cada n le asigne una sucesi´on finita sn. La existencia de semejante funci´on s no es una consecuencia de eliminar un par de cuantificadores, es una afirmaci´on sobre la existencia de un conjunto que tendr´ıa que ser respaldada por alg´un axioma que justifique la existencia de tal conjunto. Y, aun suponiendo que tuvi´eramos a nuestra disposici´on tal funci´on s, nada nos garantiza que cada sn+1 fuera una extensi´on de sn, cosa que nos har´ıa falta si quisi´eramos definir f a partir de s.
Si el lector se convence de que por ah´ı no hay salida, tal vez pase a considerar la posibilidad de que f pueda definirse por recursi´on: fijamos x0∈ A y aplicamos el teorema 2.22 para concluir que existe una funci´on f : ω −→ A tal que
f (0) = x0 y, para cada n ∈ ω, f(n + 1) es cualquier elemento de A tal que
f (n + 1) R f (n), que existe por hip´otesis.
Tenemos aqu´ı una aplicaci´on incorrecta del teorema de recursi´on, pues ´este exige que f (n) = G(f |n), para una cierta funci´on G, definida en este caso sobre el conjunto Xω ≡ {s |
W
n ∈ ω s : n −→ A} pero ¿cu´al es en nuestro caso la
funci´on G? Deber´ıa ser algo as´ı como
G(s) =
Ω
x0 si Ds =∅,
x si Ds = n + 1 ∧ x ∈ A ∧ x R s(n),
pero esto no es una definici´on aceptable de una funci´on. La ´unica forma acep- table de definir una clase es mediante el axioma de comprensi´on. Habr´ıa que expresar G en la forma G = {z | φ(z)}, para una cierta propiedad normal φ(z) o, si se prefiere, usando los convenios de notaci´on que hemos establecido,
G = {(s, x) ∈ Xω× A | φ(s, x)},
pero esto no es posible (y no por culpa del requisito de normalidad, que no afecta aqu´ı para nada, pues tratamos ´unicamente con conjuntos). El planteamiento deber´ıa ser algo as´ı como:
G = {(s, x) ∈ Xω× A | W m ∈ ω(s : m −→ A ∧ ((m = 0 ∧ x = x0) ∨ ( W n ∈ ω(m = n + 1 ∧ x R s(n))))},
pero esto no define necesariamente una funci´on, pues para un mismo s ∈ Xω, nada impide que haya varios x ∈ A que cumplan la condici´on requerida para que (s, x) ∈ G, y entonces s no tiene una ´unica imagen.
El problema es que, aunque tengamos garantizado que existe un x que cum- ple una condici´on (en este caso x R s(n)), la l´ogica permite formalizar la idea
de “tomar uno de ellos” para razonar con ´el, pero no permite formalizar la idea de “tomar uno cualquiera, pero s´olo uno”, que es lo que necesitar´ıamos para definir G y, a la larga, para construir f .
Esto no significa que los intentos de razonamiento que hemos expuesto est´en mal en t´erminos absolutos, sino que requieren un axioma m´as, el llamado axioma de elecci´on, el cual, junto con los otros axiomas que hemos discutido hasta aqu´ı, completa la teor´ıa NBG. En nuestro caso concreto, para llevar a buen puerto nuestros intentos de construir f , s´olo necesitamos una funci´on E : PA −→ A con la propiedad de que
V
X(X ⊂ A ∧ X 6= ∅ → E(X) ∈ X),
es decir, una funci´on que elija un elemento de cada subconjunto no vac´ıo de A. La funci´on E resuelve todos nuestros problemas, pues ahora podemos definir
f (0) = x0∧ V
n ∈ ω f(n + 1) = E({x ∈ A | x R f(n)}),
que es una aplicaci´on leg´ıtima del teorema de recursi´on, correspondiente a la funci´on
G(s) =
Ω
x0 si Ds =∅,
E({x ∈ A | x R s(n)}) si Ds = n + 1,
que, si se quiere, se puede expresar sin dificultad como una clase definida de acuerdo con el axioma de comprensi´on.
En general, el enunciado del axioma de elecci´on es como sigue: Axioma de elecci´on (AE)
V
X(cto X →Wf (f : X −→ V ∧Vu ∈ X(u 6= ∅ → f(u) ∈ u)).
As´ı, AE afirma que, dado cualquier conjunto X, existe una funci´on que a cada elemento u ∈ X no vac´ıo le elige uno de sus elementos. A una funci´on de estas caracter´ısticas se la llama una funci´on de elecci´on sobre X.
Observemos que no siempre es necesario apelar al axioma de elecci´on para obtener una funci´on de elecci´on. Por ejemplo, imaginemos que restringimos el problema que hemos planteado al principio de esta secci´on a una relaci´on R definida sobre A = ω. Entonces podemos demostrar la existencia de una funci´on de elecci´on tomando, por ejemplo,
E(X) =
Ω
∅ si X =∅,
m´ın X si X 6= ∅,
y la existencia de la sucesi´on {xn}n∈ω puede justificarse, por consiguiente, sin necesidad de AE.
As´ı pues, el axioma de elecci´on s´olo es necesario para garantizar la existen- cia de funciones de elecci´on en ausencia de un criterio expl´ıcito que permita construir una. Las situaciones en las que carecemos de tal criterio son muy
frecuentes. Ya hemos visto una: si partimos de una relaci´on R en una clase A y sabemos que para cada a ∈ A el conjunto AR
a = {b ∈ A | b R a} no es vac´ıo, ello no nos da un criterio para elegir uno de sus elementos para cada x ∈ A, y necesitamos recurrir al axioma de elecci´on.
En definitiva, el axioma de comprensi´on y el axioma de elecci´on son los ´
unicos axiomas de NBG que permiten probar la existencia de una clase con unas caracter´ısticas determinadas (los dem´as axiomas, salvo el de extensionalidad, que no es un axioma existencial, se limitan a afirmar que ciertas clases dadas de antemano son conjuntos).
Teniendo en cuenta estas consideraciones, el ejemplo que hemos discutido se traduce finalmente en el teorema siguiente (en el que hemos modificado ligera- mente el argumento para evitar el uso de AP):
Teorema 3.21 (AI) AE → ED.
Demostraci´on: Consideremos un conjunto A y una relaci´on R en las con- diciones de ED. Consideremos el conjunto X = {AR
a | a ∈ A} que, por hip´otesis, es una familia de conjuntos no vac´ıos. Sea f : X −→ A una funci´on de elecci´on y sea g : A −→ A la funci´on dada por g(a) = f(AR
a). De este modo se cumple queVa ∈ A (g(a) ∈ A ∧ g(a) R a).
Ahora fijamos un a0∈ A y definimos por recurrencia una funci´on x : ω −→ A mediante x0= a0∧ xn+1= g(xn). Es claro que la sucesi´on {xn}n∈ω cumple lo requerido.
Como ya hemos explicado en la discusi´on previa a este teorema, no hay que confundir el uso del axioma de elecci´on con la eliminaci´on de un cuantificador existencial. En las p´aginas precedentes hemos tenido incontables ocasiones de pasar de una premisa del tipoWx x ∈ A a elegir un x ∈ A para razonar con
´el, y no importa que no tengamos ning´un criterio espec´ıfico para seleccionar un elemento de A en concreto, que ello no supone el uso del axioma de elecci´on (ni del axioma de comprensi´on), sino que es una mera consecuencia l´ogica de la premisa: estamos usando la existencia de un x ∈ A y la premisa afirmaba precisamente la existencia de un x en A. En cambio, si tenemos una familia
{Xi}i∈I de conjuntos no vac´ıos, esto significa que Vi ∈ IWx x ∈ Xi, y de aqu´ı no podemos pasar a considerar una sucesi´on {xi}i∈I tal que
V
i ∈ I xi ∈ Xi sin recurrir al axioma de comprensi´on (si tenemos alg´un criterio expl´ıcito para seleccionar un elemento de cada Xi) o al axioma de elecci´on (si no lo tenemos), pues la conclusi´on va m´as all´a de lo contenido en la premisa: partimos de la existencia de conjuntos en cada Xi y pretendemos concluir la existencia de un conjunto que no es ninguno de los conjuntos cuya existencia se postula, sino una aplicaci´on x : I −→ S
i∈I
Xi.
No obstante, a partir del hecho de que podemos eliminar cuantificadores existenciales, podemos probar un caso particular del axioma de elecci´on incluso en ausencia de criterios para realizar las elecciones. Se trata de que todo con- junto finito siempre admite una funci´on de elecci´on. Estudiaremos los conjuntos
finitos en el cap´ıtulo siguiente, pero para probar esto s´olo necesitamos la mera definici´on (y anticipamos tambi´en, de paso, la de conjunto numerable): Definici´on 3.22 Un conjunto x es finito siWn ∈ ωWf f : n −→ x biyectiva).
Diremos2 que x es numerable si es finito o bienWf f : ω −→ x biyectiva. As´ı pues, un conjunto es finito si sus elementos se pueden “contar”, es decir, que se pueden emparejar con los elementos de un n´umero natural.3 Los conjun- tos numerables son los que se pueden “contar” a expensas de agotar todos los n´umeros naturales en el proceso de c´omputo.
Teorema 3.23 Todo conjunto finito tiene una funci´on de elecci´on.
Demostraci´on: Basta probar, por inducci´on sobre n, que V
x(Wf f : n −→ x biyectiva → x tiene una funci´on de elecci´on).
En efecto, para n = 0 tenemos que x =∅ y h = ∅ es trivialmente una funci´on de elecci´on en x. Si es cierto para n, supongamos que f : n + 1 −→ x biyectiva, sea u = f (n) y x0 = f [n]. Es claro entonces que f |
n : n −→ x0 biyectiva, luego por hip´otesis de inducci´on existe una funci´on de elecci´on h : x0−→ V . Si u 6= ∅, tomamos v ∈ u, y si u = ∅ tomamos v = ∅. Es claro entonces que h ∪ {(u, v)} es una funci´on de elecci´on sobre x.
En cambio, no es posible demostrar sin el axioma de elecci´on que todo con- junto numerable tiene una funci´on de elecci´on. Sin embargo, para una gran parte de las matem´aticas que requieren el axioma de elecci´on basta con el siguiente caso particular:
Axioma de elecci´on numerable (AEN) Todo conjunto numerable tiene una funci´on de elecci´on.
O a lo sumo con el principio de elecciones dependientes ED, que es ligera- mente m´as fuerte, como se ve en el teorema siguiente:
Teorema 3.24 (AI, AP) ED → AEN.
Demostraci´on: Sea X = {xn | n < ω} un conjunto numerable y sea A el conjunto de las funciones de elecci´on sobre conjuntos Xm = {xn | n < m}, es decir, f ∈ A si y s´olo si existe un m ∈ ω tal que f : Xm−→ {∅} ∪ S
n<m
xn cumple queVn < m(xn6= ∅ → f(xn) ∈ xn).
Claramente A 6= ∅ y podemos definir en A la relaci´on dada por f R g si y s´olo si g √ f. As´ı A y R cumplen las hip´otesis de ED, pues si g ∈ A y
2No es infrecuente que se defina un conjunto numerable como un conjunto biyectable con ω (excluyendo as´ı los conjuntos finitos). Seg´un la definici´on que estamos adoptando, tales conjuntos ser´an para nosotros los conjuntos infinitos numerables.
3Notemos que estamos empleando una alteraci´on t´ecnica intrascendente de lo que normal- mente se entiende por “contar”. Cuando decimos que un conjunto X tiene 3 elementos es porque hemos numerado sus elementos como x1, x2 y x3, mientras que, para justificar que cumple literalmente la definici´on que hemos dado, necesitamos una biyecci´on f : 3 −→ X, lo que supone contar sus elementos como x0, x1y x2.
Df = {xn | n < m}, si xm 6= ∅ tomamos un u ∈ xm, y en caso contrario tomamos u = ∅, de modo que f = g ∪ {(xm, u)} cumple f ∈ A ∧ f R g. Por ED existe una sucesi´on {fn}n<ω de elementos de A de modo que
V
n < ω(fn∈ A ∧ fn√ fn+1). Es claro entonces que f = S
n∈ω
fn : X −→ V y es una funci´on de elecci´on sobre X.
Nota Observemos que ED no puede probarse4 a partir de AEN, pues en la prueba de ED a partir de AE hemos necesitado una funci´on de elecci´on sobre el conjunto de todos los conjuntos de la forma AR
a, que no es necesariamente nume- rable. Al final, lo que proporciona ED es una cantidad numerable de elecciones, al igual que AEN, pero las elecciones de ED son “dependientes” en el sentido de que se elige xn+1en funci´on de cu´al es el xn elegido previamente (m´as precisa- mente, elegimos xn+1en el conjunto ARxn, que depende de la elecci´on anterior),
mientras que AEN s´olo proporciona una cantidad numerable de elecciones in- dependientes (fijamos un conjunto numerable y elegimos un elemento de cada uno de sus elementos, sin tener en cuenta cu´al hemos elegido en otro cualquiera de ellos).
Otra consecuencia de ED (luego de AE) que no puede probarse a partir de AEN es esta caracterizaci´on de las relaciones bien fundadas:
Teorema 3.25 (AI, ED) Una relaci´on R est´a en un conjunto A est´a bien fundada si y s´olo si no existe ninguna sucesi´on {xn}n∈ω de elementos de A tal
queVn ∈ ω xn+1R xn.
Demostraci´on: Una implicaci´on es inmediata y no requiere ninguna forma de AE: si existe tal sucesi´on, entonces el conjunto B = {xn | n ∈ ω} es un subconjunto no vac´ıo de A que no tiene R-minimal, luego la relaci´on no est´a bien fundada.
Supongamos ahora que la relaci´on R no est´a bien fundada, con lo que existe un B ⊂ A no vac´ıo sin R-minimal. Esto quiere decir que si x ∈ B, al no ser
R-minimal existe un y ∈ B tal que y R x, pero esto significa que B y R cumplen
las hip´otesis de ED, luego existe una sucesi´on {xn}n∈ωde elementos de B (luego de A) que cumple la condici´on del enunciado.
Hay un resultado que parece muy elemental, pero en realidad requiere el axioma de elecci´on:
Teorema 3.26 (AE) Sean x e y dos conjuntos no vac´ıos. Existe f : x −→ y
inyectiva si y s´olo si existe g : y −→ x suprayectiva.
4No estamos aqu´ı en condiciones de justificar ning´un resultado negativo de este tipo. Esta nota s´olo pretende explicar por qu´e es imposible, sin probarlo realmente
Demostraci´on: Supongamos que existe f : x −→ y inyectiva y veamos c´omo construir la aplicaci´on g. Esta implicaci´on no requiere el axioma de elecci´on, pues basta tomar un u ∈ x y definir
g(v) =
Ω
f−1(v) si v ∈ f[x],
u si v ∈ y \ f[x].
Es claro entonces que g es suprayectiva. M´as a´un, es claro que f ◦ g = Ix, luego la suprayectividad de g es consecuencia del teorema 1.14.
Supongamos ahora que g : y −→ x suprayectiva y sea
X = {g−1[u] | u ∈ x},
que es un conjunto por reemplazo (la aplicaci´on x −→ X dada por u 7→ g−1[u] es suprayectiva). Por el axioma de elecci´on, existe una funci´on de elecci´on
E : X −→ V . Definimos f : x −→ y mediante f(u) = E(g−1[u]). De este modo, para cada u ∈ x tenemos que f(u) ∈ g−1[u], luego g(f (u)) = u, luego f ◦ g = I
x y de nuevo 1.14 implica que f es inyectiva.
Notemos que el teorema anterior no requiere el axioma de elecci´on si supo- nemos que existe un buen orden en y (lo que sucede, por ejemplo, si y = ω), pues entonces podemos definir la funci´on de elecci´on como E(a) = m´ın a, para todo a ∈ X, pues se cumple que a ⊂ y.
Si al teorema anterior le a˜nadimos la condici´on f ◦g = Ixque hemos obtenido en la prueba, tenemos de hecho una equivalencia con el axioma de elecci´on. La probamos a continuaci´on junto con otras m´as:
Teorema 3.27 Las afirmaciones siguientes son equivalentes:
a) AE
b) Si g : y −→ x es una aplicaci´on suprayectiva, existe f : x −→ y tal que f ◦ g = Ix.
c) Para toda familia {Xi}i∈Ide conjuntos no vac´ıos (donde I es un conjunto)
existe otra familia {si}i∈I tal que V
i ∈ I si∈ xi.
d) Para todo conjunto X formado por conjuntos no vac´ıos disjuntos dos a dos, existe un conjunto a ⊂SX tal queVu ∈ XWv u ∩ a = {v}.
Demostraci´on: a) ⇒ b) se sigue de la demostraci´on del teorema anterior. b) ⇒ c) Consideremos la aplicaci´on g : S
i∈I{i}×Xi−→ I dada por g(i, u) = i. Como los conjuntos Xi son no vac´ıos, tenemos que g es suprayectiva. Sea
f : I −→ S
i∈I({i} × Xi
) seg´un b), es decir, tal que, para cada i ∈ I, se cumple que f (i) = (i, v), para cierto v ∈ Xi. Basta tomar s = Rf .
c) ⇒ d) Podemos ver a X como una familia {i}i∈X de conjuntos no vac´ıos. Por c) existe {si}i∈X tal que
V
d) ⇒ a) Dado un conjunto X, no perdemos generalidad si suponemos que no contiene a∅. El conjunto X0= {{i} × i | i ∈ X} est´a formado por conjuntos no vac´ıos disjuntos dos a dos. Por d) existe un conjunto f que contiene exactamente un elemento de cada uno de ellos. Es claro que f es una funci´on de elecci´on sobre X.
Nota La familia {si}i∈I no es m´as que un elemento del producto cartesiano Q i∈I Xi ≡ {s | s : I −→ S i∈I Xi∧ V i ∈ I si∈ Xi},
por lo que AE resulta ser equivalente a que el producto cartesiano de una familia de conjuntos no vac´ıos es no vac´ıo.
El axioma de elecci´on interviene de forma esencial en la demostraci´on de numerosos teoremas importantes del ´algebra, el an´alisis o la topolog´ıa (para probar la existencia de base en todo espacio vectorial, la existencia de ideales maximales en anillos unitarios, la existencia de clausuras algebraicas, el teorema de Tychonoff, el teorema de Hann-Banach, etc.) En la prueba de estos resultados y otros muchos, es mucho m´as pr´actico utilizar una forma equivalente, un tanto t´ecnica, conocida como lema de Zorn:
Una cadena en un conjunto parcialmente ordenado X es un subconjunto
X ⊂ X para el que se cumplaVuv ∈ C(u ≤ v ∨ v ≤ u). Una cota superior para
un conjunto C ⊂ X es un u ∈ X tal queVv ∈ C v ≤ u. Un elemento maximal
en X es un m ∈ X tal que ¬Wu ∈ X m < u. El teorema siguiente contiene
el enunciado del lema de Zorn junto con otras afirmaciones equivalentes menos t´ecnicas:
Teorema 3.28 (AP) Las afirmaciones siguientes son equivalentes:
a) Axioma de elecci´on Todo conjunto tiene una funci´on de elecci´on. b) Principio de numerabilidad Todo conjunto puede biyectarse con un
ordinal.
c) Principio de buena ordenaci´on Todo conjunto puede ser bien orde-
nado.
d) Lema de Zorn Todo conjunto parcialmente ordenado no vac´ıo en el que toda cadena tenga una cota superior tiene un elemento maximal.
e) Lema de Zorn (variante) En todo conjunto parcialmente ordenado no vac´ıo en el que toda cadena tenga una cota superior, cada elemento est´a por debajo de un elemento maximal.
Demostraci´on: a) ⇒ b) Supongamos que un conjunto x no puede bi- yectarse con ning´un ordinal. En particular tenemos que x 6= ∅. Fijemos una
funci´on de elecci´on f : Px −→ x. El teorema de recursi´on 2.22 nos da una funci´on F : Ω −→ x tal que
V
α ∈ Ω F (α) = f(x \ F [α]).
Veamos por inducci´on sobre α que F |α: α −→ x inyectiva.
Si α = 0 es trivial. Si es cierto para α, entonces F [α] 6= x, porque estamos suponiendo que x no puede biyectarse con un ordinal. Entonces, puesto que
x \ F [α] 6= ∅, tenemos que F (α) = f(x \ F [α]) ∈ x \ F [α], de donde se sigue
claramente que F |α+1es inyectiva.
Si λ es un ordinal l´ımite y F |α es inyectiva para todo α < λ, entonces es claro que F |λ es inyectiva, pues si δ < ≤ < λ, tambi´en δ < ≤ < ≤ + 1 < λ, y la inyectividad de F |≤+1 implica que F (δ) 6= F (≤).
A su vez esto implica que F : Ω −→ x inyectiva, pero esto es imposible, pues entonces F [Ω] ⊂ x ser´ıa un conjunto y por reemplazo tambi´en lo ser´ıa Ω.
b) ⇒ c) es inmediato: dado un conjunto x, tomamos un ordinal α y una biyecci´on f : x −→ α y definimos la relaci´on en x dada por u ≤ v ↔ f(u) ≤ f(v). Es inmediato comprobar que se trata de un buen orden en x.
c) ⇒ e) Sea (x, ≤) un conjunto en las hip´otesis del lema de Zorn y fijemos un u0 ∈ x. Hemos de encontrar un elemento maximal m ∈ x tal que u0 ≤ m. Para ello suponemos que no existe tal elemento maximal, es decir, que si u0≤ v,