Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore calculo_diferencial_integral_func_una_var

calculo_diferencial_integral_func_una_var

Published by veroronquillo1, 2021-07-12 04:20:21

Description: calculo_diferencial_integral_func_una_var

Search

Read the Text Version

La idea de infinito en la filosofía y la matemática Griegas 178 apariencias a las cuales no responde realidad alguna. La filosofía de Parménides fue muy criti- cada porque choca con nuestras creencias más básicas sobre la realidad. Zenón ideó sus paradojas o aporías (proposiciones sin salida lógica) para desacreditar a quienes negaban las ideas de Parménides, y afirmaban la realidad del cambio y la pluralidad de los seres. Aristóteles califica a Zenón de “inventor de la dialéctica”, una elaborada forma de razonamiento que consiste en probar al oponente que de sus ideas se deducen consecuen- cias inaceptables. Los argumentos de Zenón son realmente del tipo “reducción al absurdo”: se acepta provisionalmente una hipótesis y, razonando correctamente a partir de ella, se llega a una conclusión inaceptable, lo que obliga a rechazar la hipótesis inicial. Vamos a exponer, en lenguaje actual, tres de las paradojas de Zenón que van dirigidas contra las dos teorías del movimiento sostenidas en la antigüedad, las cuales dependen, claro está, de la supuesta naturaleza del tiempo y del espacio. Debes tener en cuenta que Zenón no niega el movimiento sino su inteligibilidad; la afirmación de que “el movimiento se demuestra andando” no refuta a Zenón, su desafío no es a la experiencia sensible sino a la razón. Las dos primeras paradojas parten del supuesto de que el espacio y el tiempo son infinita- mente divisibles y el movimiento continuo y uniforme. La dicotomía. Para que un móvil pueda llegar a un punto dado, debe recorrer primero la mitad de la distancia; pero antes de alcanzar esa mitad debe recorrer la mitad de la mitad. Y así suce- sivamente, “ad infinitum”. De este modo para alcanzar completamente cualquier distancia tendría que recorrer un número infinito de divisiones, lo cual es imposible en un tiempo finito. Aquiles y la tortuga. Aquiles, el de los pies ligeros, nunca alcanzará a la tortuga que avanza lentamente unos cuantos metros por delante de él. Pues cuando Aquiles alcance el punto donde estaba la tortuga, ésta ya estará un poco más adelante; y cuando de nuevo Aquiles alcance ese lugar, la tortuga habrá avanzado un poco más. Sin desanimarse, sigue corriendo, pero al llegar de nuevo donde estaba la tortuga, esta ha avanzado un poco más. . . . De este modo, la tortuga estará siempre por delante de Aquiles. Ambos argumentos están relacionados. Según la Dicotomía, para que haya movimiento debe haber un comienzo, pero no hay una distancia mínima con la que empezar; por tanto el movi- miento no puede empezar, luego no hay movimiento. Según Aquiles, un móvil para alcanzar su destino debe cubrir primero la mitad de la distancia que lo separa, pero antes deberá recorrer la mitad de esa mitad, y así sucesivamente; luego debe recorrer infinitas divisiones lo cual es imposible en tiempo finito, por tanto nunca alcanzará su destino. Es decir, una vez empezado, el movimiento no puede parar. La tercera paradoja, que se refiere a una flecha lanzada al aire, supone que el espacio y el tiempo están formados por unidades mínimas indivisibles y el movimiento es una sucesión de diminutos saltos consecutivos. La flecha. En un instante indivisible de tiempo la flecha debe permanecer quieta, pues si se moviera el instante contendría unidades de tiempo más pequeñas en las que dicho movimiento tendría lugar en contra de lo supuesto. Por tanto, en cada instante la flecha está quieta y, como el tiempo se compone de instantes, la flecha está siempre quieta y el movimiento no tiene lugar. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

La idea de infinito en la filosofía y la matemática Griegas 179 La influencia de las aporías de Zenón en filosofía, lógica y matemáticas ha sido notable y se ha escrito y se sigue escribiendo mucho sobre ellas ([12] es una de las referencias más interesantes). Más adelante veremos algunos intentos, bastante ingenuos, de resolver las dos primeras por medio de la teoría de series. Despidamos a Zenón con una cita de Borges. Zenón es incontestable, salvo que confesemos la idealidad del espacio y del tiempo. Acep- temos el idealismo, aceptemos el crecimiento concreto de lo percibido, y eludiremos la pululación de abismos de la paradoja. ¿Tocar a nuestro concepto del universo, por ese pedacito de tiniebla griega?, interrogará mi lector. J.L. Borges, “La perpetua carrera de Aquiles y la tortuga”. 5.4.1.2. Atomismo y divisibilidad infinita El filósofo Anaximandro (ca.610 - 546 a.C.) introdujo el infinito en la filosofía Griega. Afirmó que el principio de todas las cosas existentes es el ápeiron. Etimológicamente ápeiron significa lo sin límites. Según Anaximandro, el ápeiron es infinito, porque provee la energía pa- ra que en el mundo no cese la generación y corrupción, e indeterminado, porque no es concreto y no se identifica con ninguno de los elementos agua, aire, tierra, fuego. Podemos interpretarlo como la fuente de energía primordial que garantiza la transformación y la unidad del cosmos. En el período que separa a Zenón de Elea de Aristóteles surgió la filosofía del atomismo, iniciada por Leucipo (ca. 450 - 420 a.C.) y desarrollada por Demócrito (ca. 460 - 370 a.C.). El atomismo es una filosofía materialista que se ha interpretado como una respuesta al idealismo de la Escuela Eleática (Parménides, Zenón). Los atomistas mantienen que hay dos principios fundamentales: los átomos y el vacío. Los átomos son indivisibles e invisibles, infinitos en nú- mero y de diversas formas y tamaños, perfectamente sólidos, indestructibles y permanentes. Las substancias materiales son producidas por la unión y separación de esos átomos movién- dose en el vacío. El movimiento se produce por la reordenación de los átomos entre sí; según Aristóteles, los atomistas reducen todo cambio a un mero cambio de lugar. Los atomistas ad- miten la pluralidad y el movimiento y niegan la infinita divisibilidad del espacio y la materia. El atomismo fue cuestionado por Aristóteles (384 - 322 a.C.), que realizó un análisis siste- mático del continuo. Aristóteles divide las cantidades en discretas y continuas. Los números y el lenguaje hablado son discretas y las líneas, superficies, sólidos, tiempo y espacio son conti- nuas. La respuesta a la pregunta de si una magnitud continua (un continuo) es permanentemente divisible en partes cada vez más pequeñas, o hay un límite más allá del cual no puede prose- guirse el proceso de división, depende de la naturaleza del infinito. Aristóteles dedica el Libro III de su Física a un estudio sistemático del infinito. Considera que el estudio del infinito forma parte del estudio de la naturaleza, pues lo característico de ésta es el movimiento y el cambio, y el movimiento es pensado como algo continuo, y lo que es continuo es definido con frecuencia como algo infinitamente divisible. Primero, dice Aristóteles, “hay que examinar en general si es o no es posible que haya un cuerpo sensible infinito”. Después del correspondiente estudio, llega a la conclusión de que “no existe un cuerpo que sea actualmente infinito”. Pero “la negación absoluta del infinito es una hipótesis que conduce a consecuencias imposibles”. Aristóteles expone algunas razones que apoyan la creencia en la realidad del infinito y considera los distintos sentidos de dicho término. Entre las primeras: la infinitud del tiempo, Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

La idea de infinito en la filosofía y la matemática Griegas 180 la divisibilidad de las magnitudes y la infinitud de los números; entre los segundos: lo que no puede ser recorrido o se puede recorrer pero sin llegar a un término. Es también evidente que no es posible que lo infinito exista como un ser en acto o como una subs- tancia y un principio. Luego lo infinito existe como un atributo. Lo infinito es un atributo que puede predicarse de la cantidad o de determinados procesos; es- pecialmente, los procesos de adición y de división. Aristóteles, habla en ese sentido del infinito por adición y el infinito por división o la divisibilidad infinita de un continuo. Ahora bien, el ser se dice o de lo que es en potencia o de lo que es en acto, mientras que el infinito es o por adición o por división. Y ya se ha dicho que la magnitud no es actualmente infinita [. . . ] Nos queda, entonces, por mostrar que el infinito existe potencialmente. Pero la expresión “existencia potencial” no se debe tomar en el sentido en que se dice, por ejemplo, “esto es potencialmente una estatua, y después será una estatua”, pues no hay un infinito tal que después sea en acto. Y puesto que el ser se dice en muchos sentidos, decimos que el infinito “es” en el sentido en que decimos “el día es”. Aristóteles distingue, pues, dos clases de infinito: el infinito como una totalidad completa, que llama el infinito actual y cuya existencia niega; y el infinito potencial, que concibe como un proceso secuencial de adición o de subdivisión sin final. Lo metáfora del día es muy apropiada, pues el ser de un día es un estar siendo de forma sucesiva, de manera que en ningún momento el día queda realizado plenamente como un todo. Análogamente, el infinito potencial nunca será plenamente realizado pues no hay un infinito tal que después sea en acto. La infinitud potencial es la forma usual en que concebimos el tiempo como una línea recta indefinidamente prolongable o la sucesión de los números que podemos ir formando por adición consecutiva de la unidad. Esta concepción aristotélica del infinito se aceptó sin mayores cambios hasta el siglo XIX. Es una teoría que plantea bastantes dificultades, algunas de ellas consecuencia de las ideas sobre el espacio y el tiempo del propio Aristóteles, y otras internas a la propia teoría. La forma en que la existencia potencial del infinito se relaciona con su existencia como un proceso no es fácil de interpretar, pues si el infinito actual nunca es posible, es preciso que haya un sentido en el cual un proceso que está ocurriendo en el presente mantenga su existencia potencial. Por otra parte, Aristóteles mantiene que el tiempo es infinito lo que, aparentemente, contradice la no existencia de infinitos actuales. Respecto al espacio, afirma que es finito y “resulta entonces razonable pensar que no hay un infinito por adición que sea tal que pueda superar toda magnitud”. Esto puede interpretarse como que Aristóteles niega la posibilidad, incluso potencial, de un infinito por adición de magnitudes. De todas formas, Aristóteles cree que la negación del infinito actual no afecta a los matemáticos: Esta argumentación no priva a los matemáticos de sus especulaciones por el hecho de excluir que el infinito por adición pueda recorrerse en acto. Porque no tienen necesidad de este infinito ya que no hacen uso de él, sino sólo, por ejemplo, de una línea finita que se prolongue tanto como ellos quieran. Sobre todo esto se ha escrito y se sigue escribiendo mucho. Más interesante para nosotros es la relación del infinito con la divisibilidad infinita del continuo. Los atomistas negaban la divisibilidad infinita. Su argumento era que si una magnitud con- tinua fuera dividida en todo punto, entonces no quedaría nada o solamente quedarían puntos Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

La idea de infinito en la filosofía y la matemática Griegas 181 sin extensión, porque en caso contrario el proceso de división podría proseguir. Pero, decían, si quedan puntos sin extensión, entonces no es posible recomponer la magnitud original a partir de ellos, pues por la agregación de puntos sin extensión no puede lograrse nunca una magnitud finita. Concluían que en cualquier caso la magnitud inicial se ha convertido en algo incorpóreo y, por tanto, algo que tenía existencia ha dejado de ser, lo cual, evidentemente, es un imposible. Aristóteles defendía la divisibilidad infinita pero debía refutar el argumento atomista. Su solución es muy original, pues afirma que aunque una magnitud continua puede ser dividida en cualquier punto, no puede ser dividida en todo punto. Para Aristóteles, dividir un continuo en todos sus puntos es reducirlo a lo discreto. Mientras que un continuo tiene la propiedad de densidad, es decir, entre dos cualesquiera de sus puntos siempre hay otro punto del continuo, los puntos obtenidos, después de una división infinita actual de un continuo, serían adyacentes unos con otros, y esto implica que la propiedad de densidad se habría perdido. Pero si dividimos un continuo, lo que obtenemos son dos continuos cada uno de ellos con la propiedad de densidad. Por tanto, es imposible llegar, por divisiones sucesivas, a reducir un continuo a puntos. Así, Aristóteles afirma la divisibilidad infinita pero niega la divisibilidad en todo punto, con lo que el argumento atomista deja de tener valor. Esta es una posible interpretación de los argumentos de Aristóteles sobre la divisibilidad infinita, que a veces son bastante oscuros y confusos. Además, como veremos más adelante, puede darse una interpretación matemática rigurosa de la misma. Las matemáticas griegas evitan el infinito actual. Así, Euclides, considera rectas que pueden ser prolongadas cuanto se quiera, pero no “rectas infinitas”. Igualmente, al enunciar que los números primos son infinitos, lo expresa diciendo que “Hay más números primos que cualquier cantidad de números primos propuesta”. De esta forma evita considerar el infinito actual de los números primos. En Los Elementos Euclides expone el método de exhausción (8.8.1) de Eudoxo de Cnido, que se utilizaba para calcular áreas (cuadraturas) de regiones planas. Es frecuente afirmar que este método consiste en una aproximación al área seguida de un proceso límite. No es así. Aunque su nombre sugiere “agotamiento” de una figura plana por polígonos inscritos, el méto- do estaba basado en un razonamiento muy cuidadoso de doble reducción al absurdo (llamado razonamiento apagógico), precisamente para evitar la consideración de un infinito actual. Mención aparte merece Arquímedes. Por una parte, probó en su obra El arenario que si el Universo estuviera completamente lleno de granos de arena, su número sería finito. Para lo cual desarrolla un sistema de numeración apropiado para manejar grandes números (para los griegos el número mayor era la miríada de miríadas, equivalente a 108) que le permite describir un número que, en base diez, tendría unos 80000 millones de millones de cifras. Pero también Arquímedes ideó métodos heurísticos2 que están expuestos en su obra El Método (ver 8.8.1.2), descubierta en 1906, en la que explica cómo anticipó algunos de sus descubrimientos por medio de técnicas de equilibrio usando la ley de la palanca. En estas técnicas, Arquímedes hace un uso muy libre del infinito; por ejemplo, descompone áreas planas como sumas infinitas de segmentos, es decir, reduce un continuo a elementos indivisibles, con lo cual podrían estar de acuerdo los atomistas, pero no Aristóteles. 2Por método heurístico se entiende cualquier proceso que facilite anticipar un resultado. Son métodos que se apoyan en alguna forma de intuición que conduce a la formulación de conjeturas razonables, que después deben ser probadas con métodos científicos rigurosos Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

La idea de infinito en la filosofía y la matemática Griegas 182 C1 C2 O Q P Figura 5.13. Rueda de Aristóteles 5.4.1.3. La rueda de Aristóteles Así se conoce un interesante problema propuesto por Aristóteles en su Mechanica. Si un círculo de radio r gira sin deslizar sobre su tangente horizontal, al completar un ciclo habrá avanzado una distancia igual a 2πr. Consideremos dos círculos C1 y C2, de radios r1 y r2, concéntricos, rígidamente unidos entre sí. Cada uno de dichos círculos puede avanzar girando sin deslizar sobre su tangente horizontal. Al estar rígidamente unidos, el movimiento de giro de un círculo obliga al otro círculo a girar de igual manera y, además, ambos círculos avanzarán la misma distancia, que será igual a la distancia recorrida por su centro común. Supongamos que el círculo C1 gira sin deslizar un ciclo completo, en cuyo caso también C2 gira un ciclo completo. El camino recorrido por C1 es igual a 2πr1 que es la longitud de su circunferencia; y el camino recorrido por C2 también es 2πr1, aunque la longitud de su circunferencia es 2πr2 < 2πr1. Aristóteles vio en esto algo paradójico. Desde un punto de vista cinemático no hay dificultad en explicar lo que sucede. Al girar C1, con velocidad angular ω, hace girar igualmente a C2 con igual velocidad angular. Pero también C1, al avanzar, comunica a C2 un movimiento de traslación de magnitud ωr1. El movimiento de cada punto de la circunferencia de C2 es por tanto la resultante de un movimiento circular simple de velocidad angular ω y de un movimiento de traslación horizontal de magnitud ωr1. Es la magnitud mayor, ωr1 > ωr2, de esta componente de traslación la que hace posible que el círculo pequeño, aunque realiza el mismo número de ciclos que el grande, recorra igual camino que el grande. Pero es ahora donde se plantea el problema. Es claro que ambos círculos giran continua- mente, por lo que el punto de tangencia de la circunferencia de cada uno de ellos con la tangen- te horizontal, cambia también de manera continua. Por tanto, el hecho de que ambos círculos mantengan igual ritmo de avance no puede explicarse porque el círculo menor se deslice sobre su tangente pues tal cosa no sucede. Aquí tenemos la paradoja: ¿cómo es posible que los dos caminos sean iguales sin que se produzcan deslizamientos del círculo menor que compensen la diferencia? Naturalmente, podemos suponer que el círculo que gira es el pequeño y obtenemos una situación similar a la antes descrita, en la que ahora los dos círculos recorren un camino que es igual a la longitud de la circunferencia del círculo pequeño, a pesar de que ambos realizan un ciclo completo. Se trata de un problema entre cuyos diversos aspectos, todos ellos relacionados con la idea de infinito, podemos destacar: Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito desde la Edad Media hasta el siglo XIX 183 • El problema del movimiento y la idea de continuidad. • La estructura del continuo y la divisibilidad infinita. • La correspondencia uno a uno entre los puntos de dos caminos de diferente longitud. Aristóteles solamente consideró el problema como un ejemplo de un cuerpo que mueve a otro. Observó que era indiferente que los círculos fueran concéntricos y que podían suponerse tangentes exteriores, de forma que uno se mueve apoyándose contra el otro, en cuyo caso, dijo, es claro que el camino recorrido debe ser el del círculo que se mueve. 5.4.2. El infinito desde la Edad Media hasta el siglo XIX 5.4.2.1. El infinito en la Escolástica Es sabido que las religiones lo contaminan todo de irrealidad. Después del triunfo de la Iglesia Católica, las discusiones sobre el infinito adquieren una orientación marcadamente teo- lógica. San Agustín (354 - 430), filósofo cristiano, admite el infinito actual como atributo de Dios, pero niega que Dios creara nada infinito. En su obra La Ciudad de Dios escribe refiriéndose a los números: Así que son desiguales entre sí y diferentes; cada uno es finito y todos son infinitos. ¿Y que sea posible que Dios todopoderoso no sepa los números por su infinidad, y que la ciencia de Dios llegue hasta cierta suma de números, y que ignore los demás, quién habrá que pueda decirlo, por más ignorante y necio que sea? [. . . ] Y así que la infinidad de los números para la ciencia de Dios, que la comprende, no puede ser infinita. En esa insólita cuadratura del círculo que fue la Escolástica, en su intento de conciliar la filo- sofía de Platón y Aristóteles con la revelación cristiana, destaca Santo Tomás de Aquino (ca. 1225 - 1274). La infinitud actual de Dios en todos los sentidos es un dogma Católico y Tomás de Aquino es una autoridad en tan delicada cuestión teológica. En su obra Summa Contra Gen- tiles, Capítulo 43, proporciona catorce argumentos breves para demostrar la infinitud de Dios, cada uno de ellos termina con la letanía “Por tanto Dios es infinito”. 5.4.2.2. Galileo y el infinito Para encontrar ideas más interesantes sobre el infinito debemos referirnos a Galileo Galilei (1564 - 1642). En su obra pionera sobre la dinámica y estática de sólidos Discorsi e dimostra- zioni matematiche intorno a due nuove science attenenti alla meccanica e i movimenti locali (1638), Galileo expone sus ideas sobre el infinito. Desde los tiempos de Aristóteles, la paradoja de los dos círculos había sido considerada por diversos estudiosos aunque sin avances destacables. Galileo, en la citada obra, realiza un detallado estudio de la misma y propone soluciones originales. Galileo observa que la circun- ferencia del círculo pequeño debe tocar con cada uno de sus puntos una sola vez la tangente horizontal y avanzar sobre ella una distancia mayor que su longitud. Galileo se pregunta cómo es posible que el círculo más pequeño recorra una distancia mayor que su circunferencia sin dar saltos. Antes de exponer el estudio de Galileo, debemos comentar las opiniones de su casi exacto contemporáneo Giovanni di Guevara (1561 - 1641). Sin duda, Guevara conoce las ideas Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito desde la Edad Media hasta el siglo XIX 184 matemáticas de cantidades infinitesimales y de indivisibles que se estaban desarrollando en esta época. Guevara escribe en su obra In Aristotelis Mechanicas commentarii (1627)3: Ambos, el círculo conductor y el que es movido tocan sucesivamente todas las partes individuales indivisibles de la línea del plano con un número igual de sus propias partes indivisibles, pero con la diferencia de que cuando el círculo conductor las toca, las partes en contacto son iguales entre sí, mientras que cuando el círculo movido las toca, las partes correspondientes son diferentes. Pues el contacto igual de dos cantidades depende del ajuste exacto conjuntamente de iguales partes de ambas, de forma que puedan coexistir en el mismo lugar. Pero no puede darse este ajuste exacto conjunto cuando los caminos son desiguales, pues esta desigualdad de los caminos también está presente en los lugares de contacto. . . Guevara indica que cuando el círculo menor es movido por el mayor, una parte más pequeña del círculo menor siempre está en contacto con una parte mayor de la horizontal, esto hace que dicho círculo avance más rápidamente y de esta forma se compensa la menor longitud del arco de circunferencia girado. Galileo se pregunta, en la citada obra, por la constitución básica de la materia y si la cohe- sión de los sólidos puede explicarse por la existencia de diminutos vacíos entre partículas ma- teriales y, más concretamente, si puede haber un número infinito de vacíos en una extensión finita. La Rueda de Aristóteles le parece un modelo matemático adecuado para estudiar este asunto. Galileo empieza su estudio considerando, en vez de círculos, polígonos regulares concén- tricos rígidamente unidos. Primero considera exágonos. ED F E′ D′ F F′ O C F C′ f ′ a′ A′ B′ b′ C′ c′ D′ AB c d e f a Figura 5.14. Exágonos de Galileo Sometemos el exágono mayor a un giro de 60 grados con centro en el vértice B. Este giro lleva el vértice C al punto del mismo nombre, c, sobre la línea de base, y el centro O lo lleva a donde estaba el vértice C. Este giro lleva el lado B ′C ′ del exágono menor al segmento del mismo nombre b′C ′ de la línea de base de dicho exágono, y al hacerlo deja en medio un segmento B ′b′. Este proceso se repite con sucesivos giros de 60 grados con centros respectivos en los puntos c, d, e, f hasta completar un ciclo. El exágono mayor ha recorrido sobre su línea de base una distancia igual a su perímetro. El exágono menor avanza a saltos, pues en cada giro deja en medio un segmento de su línea de base con el que no entra en contacto (B ′b′, C ′c′. . . ). El camino que dicho exágono recorre es su perímetro más los saltos correspondientes que, en 3Traduzco libremente una cita de Guevara recogida en el trabajo más completo que conozco sobre la rueda de Aristóteles [4], el cual estoy siguiendo muy de cerca en esta exposición Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito desde la Edad Media hasta el siglo XIX 185 el caso considerado en la figura, sería igual a 5 veces y media el lado del exágono mayor. Por su parte, el centro recorre una distancia igual a 5 veces el lado del exágono mayor. Es claro que conforme aumenta el número de lados, la longitud del lado del polígono mayor es cada vez más pequeña y las longitudes recorridas son cada vez más parecidas. En este punto, Galileo considera los círculos como polígonos con un número infinito de lados (un infinito actual, no potencial) y escribe: La distancia recorrida por el infinito número de lados continuamente distribuidos del círculo mayor es igualado por la distancia recorrida por el infinito número de lados del menor, pero, en el último caso, por la interposición de igual número de vacíos entre los lados. Y al igual que los lados no son finitos en número sino infinitos, igualmente los vacíos interpuestos no son finitos sino infinitos. Es decir, el número infinito de puntos sobre la línea recorrida por el círculo mayor son todos ellos ocupados (esto es, en el transcurso de la revolución de ese círculo han sido ocupados por un “lado” del círculo), pero sobre la recorrida por el círculo menor son parcialmente ocupados y parcialmente vacíos. Otra paradoja estudiada por Galileo es la de la “equivalencia entre una circunferencia y un punto”. Para explicarla, consideremos un rectángulo formado por dos cuadrados iguales unidos por un lado común. Recortemos en este rectángulo una semicircunferencia de centro en la mitad del lado superior del rectángulo e igual radio. La figura que resulta de quitar dicha semicircunferencia al rectángulo se gira alrededor de su eje de simetría y se obtiene un sólido de revolución parecido a un cuenco. Supongamos ahora inscrito en dicho sólido un como circular recto cuya base coincide con la del cuenco y de altura igual a la del cuenco. O CB UV Q D PA Figura 5.15. Paradoja circunferencia-punto Cada plano paralelo a la base del cuenco determina en su intersección con el cono un círcu- lo, y en su intersección con el cuenco una corona circular. Es muy fácil comprobar que dichos círculo y corona circular tienen igual área. Si ahora consideramos planos paralelos a la base del cuenco que se van acercando al borde superior del mismo, las áreas de las intersecciones de dichos planos con el cono y el cuenco son siempre iguales. El último de dichos planos da como intersección con el cuenco una circunferencia (el borde del cuenco) y con el cono un punto (el vértice del cono). Como los límites de cantidades iguales entre sí deben también ser iguales entre sí, Galileo se pregunta por qué no podemos considerar la circunferencia como igual a su centro. Si lo hacemos, llegaremos a la conclusión de que todas las circunferencias son iguales entre sí e iguales a un punto. La misma figura anterior pone de manifiesto que la semicircunferencia está formada por Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 186 tantos puntos como los que forman la poligonal CDAB. Pues cada semirrecta con origen en O corta a la semicircunferencia en un único punto Q y a la poligonal en otro único punto P . Así podemos emparejar los puntos de la semicircunferencia con los de la poligonal y de esta forma los agotamos todos. Por tanto ambas líneas tienen igual número infinito de puntos. Si llamamos ℓ a la longitud de AB, la semicircunferencia tiene longitud πℓ, menor que la longitud de la poligonal CDAB que es igual a 4ℓ. Galileo escribe al respecto: Estas dificultades son reales; y no son las únicas. Pero recordemos que estamos tratando con infinitos e indivisibles, los cuales trascienden nuestra comprensión finita, los primeros a causa de su magnitud, los últimos debido a su pequeñez. [. . . ] intentamos, con nuestras mentes finitas, discutir sobre el infinito, asignándole propiedades que damos a lo finito y limitado; pero pienso que esto es incorrecto, dado que no podemos hablar de cantidades infinitas como si fuesen mayores, menores o iguales a otras. Otra paradoja considerada por Galileo, es la que se deduce de la observación de que para cada número natural n podemos construir un cuadrado de lado n, cuya área es igual a n2, de donde se deduce que hay tantos números naturales como cuadrados perfectos. Sin embargo la mayoría de los números no son cuadrados perfectos. A la vista de ello, Galileo escribe: [. . . ] el total de los números es infinito, y el número de cuadrados es infinito; ni es menor el número de cuadrados que el de la totalidad de números, ni el otro mayor que el anterior; y, finalmente, los atributos “igual”, “mayor” y “menor” no son aplicables al infinito, sino solo a cantidades finitas. 5.4.2.3. El Cálculo y el infinito Una característica de las matemáticas del siglo XVII es el libre uso del infinito. En los dos primeros tercios del siglo XVII se desarrollan una variedad de métodos infinitesimales que preludian el cálculo diferencial, así como técnicas de cuadraturas basadas en la descomposición de recintos planos o de sólidos en infinitos elementos indivisibles. El matemático inglés John Wallis introdujo en 1655 en su obra De Sectionibus Conicis, el símbolo del “lazo del amor”, ∞, con el significado de “infinito”. La invención del Cálculo, en el último tercio del siglo XVII, ordena y sistematiza estos procedimientos, y proporciona algoritmos generales para resolver multitud de problemas que antes se abordaban con técnicas específicas para cada caso. Las cantidades infinitesimales, los casi imprescindibles infinitésimos, que ya son viejos amigos nuestros, son otra forma del infinito, en este caso, de lo infinitamente pequeño. Durante el siglo XVIII y parte del XIX, los infinitésimos se usaron de forma casi generalizada porque, a pesar de los problemas de todo tipo que planteaban, eran útiles y eficaces para resolver problemas y una herramienta heurística muy apreciada. Es preferible diferir, hasta que estudiemos el nacimiento del Cálculo, el estudio de algunos aspectos de este proceso cuya consideración ahora nos apartaría del tema que estamos viendo. 5.4.3. El infinito matemático y el nacimiento de la teoría de conjuntos A principios del siglo XIX, la actitud de los matemáticos ante el infinito no era diferente a la mantenida por Galileo doscientos años antes. La consideración del infinito actual conducía a paradojas; en particular, la llamada paradoja de la reflexividad, es decir, la posibilidad de Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 187 establecer una biyección entre un conjunto infinito y una parte del mismo, indicaba que la consideración del infinito actual contradecía el principio lógico de que “el todo es mayor que las partes”. Para los principales matemáticos de la época, como Gauss y Cauchy, el infinito seguía siendo un infinito potencial, un concepto sin contenido matemático, una palabra que servía para designar un proceso sin punto final. Gauss lo expresó claramente en una carta a su amigo Schumacher en 1831: Debo protestar vehementemente contra el uso del infinito como algo completado, pues esto nunca está permitido en matemáticas. El infinito es simplemente una forma de hablar; una forma resumida para la afirmación de que existen los límites a los cuales ciertas razones pueden aproximarse tanto como se desee, mientras otras son permitidas crecer ilimitadamente. La consideración del infinito actual como objeto matemático exige disponer de objetos mate- máticos que puedan ser llamados “infinitos”. Que los números naturales son potencialmente infinitos quiere decir que son una sucesión a la que podemos agregar términos indefinidamen- te, muy diferente es la consideración del infinito actual de todos los números naturales (a lo que estamos ya acostumbrados y no nos causa mayor problema), que equivale a considerarlos como un todo acabado, como un conjunto formado por todos ellos. Esto indica que una teoría matemática del infinito supone la consideración de conjuntos infinitos. Es imposible separar la teoría de conjuntos y la teoría del infinito. En esto, como en otras cosas, Bernahrd Bolzano fue un adelantado a su tiempo. En su libro Las Paradojas del Infinito, publicado en 1851, tres años después de su muerte, Bolzano se propone estudiar las paradojas conocidas y mostrar que, debido a la falta de precisión en el uso del término infinito, daban lugar a aparentes contradicciones. Es necesario, afirma, definir el término infinito y las matemáticas son el contexto apropiado para ello. Naturalmente, Bolzano, está refiriéndose al infinito actual. Con la idea de fundamentar matemáticamente la noción de infinito actual, Bolzano introduce los términos de agregado, conjunto y multitud, siendo en esta obra la primera vez que la palabra “conjunto” es usada con un significado matemático preciso. Un agregado es una totalidad compuesta de objetos bien definidos; un conjunto es un agregado donde el orden de sus partes es irrelevante y donde nada esencial se cambia si solo se cambia el orden (es decir, un agregado sin estructura alguna); una multitud es un conjunto cuyos miembros son individuos de una misma especie. Bolzano considera un conjunto como un todo, sin necesidad de considerar separadamente cada uno de sus elementos. El ejemplo que propone es muy significativo a este respecto: . . . puedo pensar en el conjunto, o agregado, o si se prefiere, en la totalidad de los habitantes de Praga o de Pekín sin formar una representación separada de cada habitante individual. Bolzano abandona así el punto de vista constructivo, la idea de que un conjunto se va formando a partir de sus elementos mediante alguna clase de algoritmo. Bolzano define una multitud infinita como aquella de la cual cualquier multitud finita sola- mente puede ser parte de la misma. Debemos observar que esta definición no es la tradicional en la que infinito es definido como la negación de lo finito. Con respecto a la existencia de conjuntos infinitos, Bolzano afirmó que “el conjunto de todas las verdades absolutas es un con- junto infinito”. Su idea es partir de una proposición que se sabe verdadera a la que podemos llamar A; a partir de ella podemos formar otra “A es verdadera” que, claramente, es diferente de la proposición A y este proceso puede proseguirse indefinidamente. Esta idea parece muy Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 188 ingenua pero, más de treinta años después, Dedekind se inspiró en ella para probar el mismo resultado. Bolzano mantiene que el criterio de validez para la existencia de conjuntos infinitos debe basarse en su naturaleza no contradictoria. Tan pronto como disponemos de un concepto, A, el cual representa los objetos a, b, c, d, . . . y no otros, es extremadamente fácil llegar a un concepto que represente el agregado de todos estos objetos tomados juntos. Solamente se necesita combinar la idea expresada por la palabra “agregado” y el concepto A, en la manera expresada por las palabras “el agregado de todo A”. Esta simple observa- ción, cuya corrección confío que será evidente para todos, elimina todas las dificultades planteadas contra la idea de un conjunto que comprende infinitos miembros. En términos actuales, lo que Bolzano afirma es que dada una proposición P (x), relativa a los elementos de un conjunto X, podemos formar el conjunto Y = {x ∈ X : P (x) es verdadera}. Bolzano se propone establecer un criterio de comparación para conjuntos infinitos. La pa- radoja de la reflexividad no le preocupa tanto como a Galileo; al contrario, el hecho de que pueda establecerse una biyección entre un conjunto y una parte de él le parece “una de las más notables característica de los conjuntos infinitos”. Pero en este punto crucial Bolzano no eligió el criterio adecuado. . . . el conjunto de todas las cantidades entre 0 y 5 (o menores que 5) es claramente infinito, al igual que lo es el conjunto de todas las cantidades menores que 12. Con no menos seguridad es el último conjunto mayor que el primero, pues el primero constituye solamente una parte del último [. . . ] Pero no menos cierto que todo esto es lo siguiente: si x representa una cantidad arbitraria entre 0 y 5, y si fijamos la razón entre x e y por la ecuación 5y = 12x, entonces y es una cantidad entre 0 y 12; y recíprocamente, siempre que y esté entre 0 y 12, x está entre 0 y 5. Es decir, Bolzano afirma que la aplicación dada por y = 12 x para x ∈ [0, 5] establece una bi- 5 yección entre dicho intervalo y el intervalo [0, 12]. Pero, cuando se trata de conjuntos infinitos, a Bolzano no le parece que la existencia de una biyección sea criterio suficiente para afirmar que ambos conjuntos son “equinumerosos” y elige como criterio de comparación la relación de inclusión entre conjuntos. De esta forma puede comparar conjuntos infinitos pero no puede cuantificar el infinito y, por tanto, no logra desarrollar, pese a su intento, una aritmética del infinito. Le estaba reservada a Georg Cantor (1845 - 1918) la gloria de ser el primer matemático que domesticara el infinito. Cantor se vio obligado a defender constantemente sus innovadoras ideas en contra de las opiniones de influyentes matemáticos de su tiempo, alguno de los cuales, como Leopold Kronecker, pasó incluso del ataque científico al ataque personal, si bien otros destacados matemáticos como Weierstrass, Dedekind o Hilbert estuvieron de su parte. El inte- rés de Cantor por los conjuntos infinitos de puntos y la naturaleza del continuo procede de sus tempranos trabajos en series trigonométricas. En un notable trabajo de 1872, Cantor desarrolló una teoría de los números reales basada en sucesiones de números racionales. Ese mismo año, un poco antes, Dedekind había publicado su teoría de las cortaduras. No es ésta la única ocasión en que coinciden los intereses de Cantor y Dedekind. De hecho, la contribución de Dedekind a la creación de la teoría de conjuntos es mucho más importante de lo que suele reconocerse. En su famoso trabajo Was sind und was sollen die Zahlen (¿Qué son y para qué sirven los números?) publicado en 1888, Dedekind precisa el significado de las operaciones elementales de la teoría de conjuntos ingenua, y da la definición general de función entre conjuntos abstractos, generalizando así la anteriormente dada por Dirichlet para funciones reales. Así mismo Dedekind da la siguiente definición: Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 189 Un sistema S se llama infinito cuando es semejante a una parte propia de sí mismo; en caso contrario, se dice que S es un sistema finito. En términos actuales: un conjunto S es infinito, si hay un subconjunto propio, Ø A S, y una biyección de A sobre S. En una nota a pie de página, Dedekind, afirma haber comunicado esa definición a Cantor ya en 1882 y varios años antes a otros colegas. También fue Dedekind un precursor de las técnicas conjuntistas en Álgebra, introduciendo, entre otros, los conceptos de cuerpo, ideal y módulo. En una carta a Dedekind, de fecha 29 de noviembre de 1873, Cantor afirmaba, sin incluir prueba alguna, que los racionales posi- tivos y, más generalmente, el conjunto de las sucesiones finitas de enteros positivos, podía ponerse en correspondencia biyectiva con los enteros positivos, y preguntaba si eso mismo se podía hacer con los números reales. Dedekind le respondió, a vuelta de correo, que en su opinión nada se oponía a ello, y añadió, con demostración in- cluida, que el conjunto de los números algebraicos sí es biyectivo con el de los enteros positivos. Figura 5.16. Cantor 5.5 Definición. Los números algebraicos son números, reales o complejos, que son raíces de alguna ecuación polinómica con coeficientes enteros. Por tanto, un número real o complejo x es algebraico si hay números enteros ck ∈ Z, (k = 01, 2, . . . n) tal que x satisface la ecuación polinómica c0 + c1x + c2x2 + · · · + cnxn = 0 Los números que no son algebraicos se llaman trascendentes. Todo número racional es evidentemente algebraico, pero también lo son las raíces de cual- quier orden de números racionales positivos y muchos más. Intuitivamente, los números alge- braicos son los que pueden obtenerse a partir de los enteros por procedimientos algebraicos: suma, producto, cociente, división, raíces, iterados un número finito cualquiera de veces. En ese sentido podemos decir que los números algebraicos no están “muy alejados” de los ente- ros. Los números trascendentes son justamente lo contrario: son números irracionales “muy alejados” de los enteros. Para facilitar la exposición que sigue voy a dar algunas definiciones de conceptos introdu- cidos por Cantor años más tarde. 5.6 Definición. Se dice que dos conjuntos A y B son equipotentes si existe una aplicación biyectiva de uno de ellos sobre el otro. Los conjuntos equipotentes al conjunto N de los números naturales se llaman conjuntos numerables. Los conjuntos numerables son aquellos conjuntos cuyos elementos se pueden contar ¡aun- que sean infinitos! El resultado, citado por Cantor, de que Q es numerable, no deja de ser muy sorprendente y contrario a la intuición, pues si r < s son números racionales cualesquiera, Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 190 entre ellos dos hay siempre infinitos números racionales. Pese a ello, no hay más números racionales que números naturales. Poco después de las cartas citadas, Cantor logró demostrar que el conjunto de los números reales no es numerable. De aquí se deduce enseguida que en todo intervalo de R, hay infinitos números trascendentes. Cantor publicó estos resultados, el suyo y el de Dedekind, en un tra- bajo de tres páginas titulado Uber eine Eigenshaft des Inbegriffes aller reellen algebraischen Zahlen (Sobre una propiedad del sistema de todos los números algebraicos reales) (1874). Es muy llamativo que el título de este trabajo, considerado como el nacimiento oficial de la teoría de conjuntos, no haga referencia alguna al resultado que hoy consideramos como el princi- pal: la no numerabilidad de R. Además la propia presentación del trabajo elude destacar estos resultados. Posiblemente, Cantor temía la reacción que pudiera provocar un trabajo tan radical- mente innovador. Porque lo que él hacía era probar que en cualquier intervalo [a, b] ⊂ R con a < b hay, en un sentido matemático preciso, más números que todos los números algebraicos juntos, de donde se deducía que en [a, b] tenía que haber números trascendentes. Esta es una demostración de existencia pura, algo nuevo en las matemáticas. Demostrar que un número concreto es trascendente es muy difícil. Era conocida la trascen- dencia del número e, demostrada por Charles Hermite en 1873, y Ferdinand Lindemann logró probar la trascendencia de π en 1882 (demostrando así que el problema de la cuadratura del círculo no tenía solución). Naturalmente, Cantor sabía muy bien que había descubierto una propiedad específica del continuo: su no numerabilidad. Disponía ya de dos tipos de conjuntos infinitos: N y R, clara- mente N tenía un tamaño más pequeño que R. Precisar esa idea de tamaño y elaborar una teoría de comparación de conjuntos infinitos es lo que hizo Cantor en los siguientes veinte años y, casi contra su voluntad, se vio llevado a desarrollar la teoría de números transfinitos y la teoría de conjuntos como una disciplina matemática independiente. En 1877, Cantor probó, para su propia sorpresa, que los puntos del plano podían ponerse en correspondencia biyectiva con R, y, más general, que los espacios Rn son todos ellos biyectivos a la recta real. Este resultado fue de los que más desconcierto provocó entre los matemáticos contemporáneos. Cantor siguió desarrollando sus ideas en una serie de seis trabajos publicados en los años 1878 a 1884. En 1883, en su trabajo Fundamentos de una teoría general de conjuntos, escribe: La presentación de mis investigaciones hasta la fecha en teoría de conjuntos, ha alcanzado un punto donde su progreso depende de una extensión del concepto de número entero más allá de sus límites actuales. Esta extensión señala en una dirección que, por lo que yo sé, no ha sido investigada por nadie todavía. [. . . ] Por atrevido que esto pueda parecer, tengo que expresar, no sólo la esperanza, sino también la firme convicción de que esta extensión tendrá que ser considerada con el tiempo como absolutamente simple, adecuada y natural. Pero no se me oculta de ninguna manera el hecho de que en esta empresa me encuentro situado en una cierta oposición a concepciones muy extendidas acerca del infinito matemático, y a opiniones formuladas frecuentemente sobre la naturaleza del número. En este trabajo Cantor introduce los números transfinitos o cardinales transfinitos. Por el mis- mo proceso que podemos abstraer la idea de número 5 como la clase de todos los conjuntos equipotentes a un conjunto cualquiera con cinco elementos, a, b, c, d, e, de la misma forma este proceso permite, dado un conjunto M , por doble abstracción de la naturaleza de sus elemen- tos y del posible orden en que estén dados, asociar a M un objeto matemático, representado Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 191 por ♯M , que se llama su número cardinal o potencia, que es el mismo para todos los conjuntos equipotentes a M . Cuando M es finito, ♯M es el número de elementos de M ; la potencia de los conjuntos numerables (infinitos) la representó Cantor por ℵ0 (ℵ es la primera letra del alfabeto hebreo, se pronuncia “alef”); la potencia de la recta real y de cualquier intervalo de la misma, no vacío y no reducido a un punto, se representa por c y se llama la potencia del continuo. Cantor define una relación de orden entre números cardinales: si M , N son dos conjuntos, diremos que ♯M ♯N si existe una biyección de M sobre una parte de N . Si, además, no existe ninguna biyección entre ninguna parte de M y la totalidad de N , se escribe ♯M ≺ ♯N . Con esta definición se tiene que ℵ0 ≺ c. Para números cardinales finitos esta relación de orden es la usual. La demostración de que es una relación de orden entre números cardinales está muy lejos de ser fácil. La dificultad estaba en probar la propiedad reflexiva, es decir, si ♯M ♯N y también ♯N ♯M , entonces es ♯M = ♯N . Este resultado fue probado en 1898, y se conoce como teorema de Cantor - Bernstein. Se verifica, además, que es una relación de orden total, es decir, dados conjuntos M y N se verifica alguna de las relaciones ♯M ♯N o ♯N ♯M . La demostración de este resultado exige usar el llamado axioma de Zermelo. Todos esto está muy bien, pero ¿cuántos números cardinales infinitos hay? Hasta ahora solamente conocemos dos. Cantor ideó un procedimiento por el cual, dado un conjunto M , se puede construir un conjunto cuyo cardinal es estrictamente mayor. Para ello, definió el conjunto P(M ) como el conjunto cuyos elementos son todos los subconjuntos de M P(M ) = {A : A ⊂ M } Es fácil probar que ♯M ≺ ♯P(M ). Suele escribirse ♯P(M ) = 2♯M , igualdad que, para el caso de conjuntos finitos, es cierta. Por tanto, los conjuntos P(M ), P P(M ) , P P P(M ) . . . tienen todos ellos distinto número cardinal. Las operaciones con números transfinitos se definen con facilidad por medio de las corres- pondientes operaciones conjuntistas. Por ejemplo, el producto ♯M · ♯N es, por definición, igual a ♯(M × N ) donde M × N es el conjunto producto cartesiano de M y N . Análogamente se define la suma ♯M + ♯N como el número cardinal de la unión disjunta de M y N . Estas opera- ciones son asociativas, conmutativas y distributivas pero, para cardinales transfinitos se cumple que ♯M + ♯N = ♯M · ♯N = ma´x {♯M, ♯N } Esto es, la aritmética transfinita no responde a las reglas usuales de la aritmética finita. Pero esto no quiere decir que sea contradictoria, simplemente, es diferente. El desarrollo de la teoría de conjuntos condujo a algunas contradicciones, las llamadas pa- radojas de la teoría de conjuntos. Ello era debido al punto de vista ingenuo adoptado respecto a los conjuntos. Se pensaba que cualquier propiedad matemática, P (x), definía su correspondien- te conjunto, a saber, el formado por los elementos para los cuales dicha propiedad es verdadera. El propio Bolzano tenía esta idea. Consideremos la siguiente propiedad P (x) = x∉x y defi- namos el conjunto A = {x : P (x) es verdadera}. Entonces resulta que si A ∈ A es porque A∉A y si A∉A debe ser A ∈ A. Una contradicción insalvable, conocida como la paradoja de Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 192 Russell. La solución fue axiomatizar la teoría de conjuntos para evitar que pudieran formularse paradojas como la anterior y, además, restringir de alguna forma la existencia de conjuntos “demasiado grandes”. Considero que lo dicho hasta aquí es suficiente para que tengas una idea del trabajo de Cantor. Este trabajo cambió la forma de ver las matemáticas y acabó por ser ampliamente aceptado. La visión que Cantor tenía de las matemáticas puras es muy hermosa; para él, las matemáticas puras son el reino de la libertad y las llamaba “matemáticas libres”, porque son una creación de la libertad del espíritu humano cuyas únicas limitaciones son la coherencia y la no contradicción. 5.4.3.1. La no numerabilidad del continuo En esta sección final, vamos a probar la numerabilidad de Q y la no numerabilidad de R. Así mismo, estudiaremos algunos tipos de conjuntos densos y te propondré algunos ejercicios interesantes. Empezaremos demostrando un resultado que, por su aparente evidencia, parece que no precisa demostración. Se trata de un resultado muy importante y muy útil y cuya demostración me parece instructiva. 5.7 Teorema. a) Todo conjunto de números enteros no vacío y mayorado tiene máximo. b) Todo conjunto de números enteros no vacío y minorado tiene mínimo. Demostración. La estrategia de la demostración es obligada; para probar que un conjunto de números reales no vacío y mayorado tiene máximo, debemos probar que su supremo está en el conjunto. Sea E ⊂ R no vacío y mayorado. En virtud del principio del supremo, hay un número β ∈ R que es el mínimo mayorante de E. Puesto que β − 1 < β, debe haber algún z ∈ E tal que β − 1 < z y, claro está, z β. Supongamos que los elementos de E son números enteros, E ⊂ Z, y probemos que, en tal caso, debe ser z = β. Si fuera z < β tendría que haber algún w ∈ E tal que z < w β pero entonces el número w − z es un entero positivo tal que w − z < 1 lo cual es contradictorio. En consecuencia z = β ∈ E y β es el máximo de E. Análogamente se prueba que un conjunto no vacío y minorado de enteros tiene mínimo. Del teorema anterior se deducen dos importantes consecuencias. 5.8 Teorema (Principio de buena ordenación de N). Todo conjunto no vacío de números natu- rales tiene mínimo. La siguiente propiedad, también consecuencia del teorema, nos dice que N no está ma- yorado en R. Observa que es evidente que N está mayorado en Q. Pero R tiene muchos más elementos (muchísimos más, como enseguida veremos) que Q; ¿quién te asegura que, en la am- pliación de Q a R, no se han colado números irracionales más grandes que cualquier natural? De eso se trata. 5.9 Teorema (Propiedad arquimediana). Dado cualquier número real se verifica que hay nú- meros naturales mayores que él. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 193 Demostración. Como N no tiene máximo, el teorema (5.7) implica que N no puede estar mayorado en R, por tanto, dado x ∈ R, tiene que haber algún n ∈ N tal que n > x . La propiedad arquimediana del orden de R prohíbe la existencia de cantidades infinitesi- males, es decir, de números positivos pero “tan pequeños” que al multiplicarlos por cualquier número natural el producto seguía siendo “muy pequeño”. Convenzámonos de que tales “in- finitésimos”, si es que los hay, no pueden ser números reales. En efecto, si x, y son números reales positivos, la propiedad arquimediana del orden de R nos dice que tiene haber algún n ∈ N tal que n > y/x y, por tanto, nx > y. En consecuencia, por “pequeño” que sea el número real x > 0 y por “muy grande” que sea el número real y > 0, siempre hay múltiplos naturales de x mayores que y. 5.10 Definición. Se dice que un conjunto E ⊂ R es denso en R, si en todo intervalo abierto no vacío hay puntos de E. Equivalentemente, si dados x, y ∈ R con x < y hay algún z ∈ E tal que x < z < y. 5.11 Proposición. a) El conjunto de los números racionales es denso en R. b) El conjunto de los números irracionales es denso en R. Demostración. a) Supongamos que x, y ∈ R con x < y. La idea es tomar una unidad racional de medida, u, en la recta que sea menor que y − x, pues entonces es claro que un múltiplo apropiado, mu, de u estará comprendido entre x e y. Hay muchas posibilidades, se trata de elegir u y m con algún criterio que nos permita probar que x < mu < y. Los números más sencillos que podemos tomar para u son los de la forma 1/n, donde n ∈ N, con la condición 1/n < y − x, esto es, n > 1/(y − x). Parece razonable tomar el menor n que cumpla dicha desigualdad. Sea, pues: q = m´ın {n ∈ N : n > 1/(y − x)} Ahora se trata de tomar un múltiplo de u = 1/q que exceda a x, pero no demasiado. Se impone la elección: p = m´ın {m ∈ Z : m > qx} Tenemos que: p p − 1 1 q q q x< = + < x + (y − x) = y Lo que concluye la demostración. Observa que en las definiciones de q y de p se usan los resultados que acabamos de ver. b) Supongamos que x, y ∈ R con x < y. Por lo ya probado, existe r ∈ Q tal que √√ x − 2 < r < y − 2, √√ lo qu√e implica que x < r + 2 < y. Puesto que, 2 es irracional y r ∈ Q, se sigue que r + 2 es irracional y concluimos que R\\Q es denso en R. Este resultado nos dice que los números racionales y los irracionales están repartidos de manera que entre dos racionales o entre dos irracionales siempre hay infinitos racionales e Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 194 infinitos irracionales. Son dos conjuntos muy grandes, pero uno de ellos es muchísimo más grande que el otro. Hemos definido antes un conjunto numerable como aquél que es equipotente a N; es conve- niente incluir también entre los conjuntos numerables a los conjuntos finitos pues los elementos de un conjunto finito se pueden contar. Estas dos posibilidades pueden resumirse en el hecho de que exista una aplicación inyectiva del conjunto en N. Por convenio, se admite que el conjunto vacío es numerable. 5.12 Definición. Un conjunto se llama numerable si es vacío o si existe una aplicación inyectiva de él en el conjunto de los enteros positivos. Realmente esta definición lo que nos da es cierta libertad para probar que un conjunto es numerable; de hecho, se verifica el siguiente resultado. 5.13 Proposición. Un conjunto no vacío es numerable si, y sólo si, es finito o es equipotente a N. El siguiente resultado es muy útil y fácil de entender. 5.14 Proposición. Un conjunto no vacío A es numerable si, y sólo si, hay una aplicación sobreyectiva de N sobre A. Demostración. Sea f : N → A una aplicación sobreyectiva. Para cada elemento a ∈ A el conjunto {n ∈ N : f (n) = a} no es vacío por lo que podemos definir, haciendo uso del principio de buena ordenación, una aplicación g : A → N por: g(a) = m´ın{n ∈ N : f (n) = a} para todo a ∈ A Con ello se tiene que f (g(a)) = a para todo a ∈ A lo que implica que g es inyectiva y por tanto que A es numerable. La afirmación recíproca es consecuencia de la proposición anterior. Aunque el conjunto N × N parece mucho más grande que N; de hecho no es así. Podemos contar con facilidad los elementos de N × N siguiendo el camino que se sugiere (habría que prolongarlo hacia arriba y hacia la derecha) en la figura (5.17). 5.15 Proposición. N × N es equipotente a N. Demostración. 4 La aplicación ϕ : N×N → N dada por ϕ(p, q) = 2p3q para todo (p, q) ∈ N × N, es inyectiva. En consecuencia N × N es numerable y como es infinito concluimos que es equipotente a N. El siguiente resultado nos dice que si hacemos la unión de una “cantidad numerable” de conjuntos numerables obtenemos un conjunto que sigue siendo numerable. El enunciado del teorema precisa estas ideas. 4En el ejercicio (172) se define una biyección de N × N sobre N Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 195 5.16 Teorema. Sea B un conjunto numerable no vacío. Supongamos que para cada x ∈ B tenemos un conjunto numerable no vacío Ax. Se verifica entonces que el conjunto A = Ax x∈B es numerable. 9 (9, 1) (9, 2) (9, 3) (9, 4) (9, 5) (9, 6) (9, 7) (9, 8) (9, 9) 8 (8, 1) (8, 2) (8, 3) (8, 4) (8, 5) (8, 6) (8, 7) (8, 8) (8, 9) 7 (7, 1) (7, 2) (7, 3) (7, 4) (7, 5) (7, 6) (7, 7) (7, 8) (7, 9) 6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6) (6, 7) (6, 8) (6, 9) 5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6) (5, 7) (5, 8) (5, 9) 4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6) (4, 7) (4, 8) (4, 9) 3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6) (3, 7) (3, 8) (3, 9) 2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6) (2, 7) (2, 8) (2, 9) 1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6) (1, 7) (1, 8) (1, 9) 0123456789 Figura 5.17. Contando N × N Demostración. Es suficiente probar que hay una aplicación sobreyectiva de N × N sobre A. Por ser B numerable hay una aplicación sobreyectiva φ : N → B. Para cada x ∈ B, por ser Ax numerable, hay una aplicación sobreyectiva Fx : N → Ax. Es muy fácil comprobar ahora que la aplicación G : N×N → A definida por G(m, n) = Fφ(m)(n) para todo (m, n) ∈ N×N, es sobreyectiva. Puede que el siguiente diagrama sea más claro y directo que la demostración anterior. Podemos suponer que B = N, con lo que A = An. Como An es numerable, podemos escribir sus elementos como una sucesión: n∈N An = {amn : m ∈ N} = {a1n, a2n, a3n, . . . , amn, . . .} El conjunto A podemos representarlo como una matriz (ver figura (5.18)), y contar sus elemen- tos de forma parecida a como lo hemos hecho antes con N × N. 5.17 Teorema. El conjunto de los números racionales es numerable. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 196 a91 a92 a93 a94 a95 a96 a97 a98 a99 a81 a82 a83 a84 a85 a86 a87 a88 a89 a71 a72 a73 a74 a75 a76 a77 a78 a79 a61 a62 a63 a64 a65 a66 a67 a68 a69 a51 a52 a53 a54 a55 a56 a57 a58 a59 a41 a42 a43 a44 a45 a46 a47 a48 a49 a31 a32 a33 a34 a35 a36 a37 a38 a39 a21 a22 a23 a24 a25 a26 a27 a28 a29 a11 a12 a13 a14 a15 a16 a17 a18 a19 Figura 5.18. Unión numerable Demostración. Puesto que la aplicación ϕ : Z → N definida por: ϕ(n) = 2n si n > 0 1 − 2n si n 0 es una biyección, y para cada m ∈ Z el conjunto: Am = m : p∈N p es numerable, se sigue del resultado anterior que Q = Am es numerable. m∈Z Por ser Q numerable infinito se verifica que Q es equipotente a N, es decir, existen biyec- ciones de N sobre Q. Hemos respondido en parte a nuestra pregunta inicial: hay tantos números racionales como números naturales. Nos falta todavía dar alguna información del tamaño de R\\Q. 5.18 Teorema (Principio de los intervalos encajados). Para cada número natural n sea In = [an, bn] un intervalo cerrado no vacío y supongamos que para todo n ∈ N es In+1 ⊂ In. Se verifica entonces que: i) α = sup{an : n ∈ N} β = ´ınf{bn : n ∈ N}. ii) In = [α, β]. n∈N En particular, el conjunto In no es vacío. n∈N Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

El infinito matemático y el nacimiento de la teoría de conjuntos 197 Demostración. i) Las hipótesis Ø = In+1 ⊂ In, implican que an an+1 bn+1 bn para todo n ∈ N. Deducimos que las aplicaciones n → an y n → −bn, son crecientes, esto es, an am, bm bn siempre que n < m. Ahora, dados p, q ∈ N y poniendo k = ma´x{p, q}, tenemos que ap ak bk bq. Hemos obtenido así que cualesquiera sean los números naturales p, q es ap bq. Luego todo elemento de B = {bn : n ∈ N} es mayorante de A = {an : n ∈ N} y por tanto α = sup A bn para todo n ∈ N. Lo cual, a su vez, nos dice que α es un minorante de B y por tanto concluimos que α β = ´ınf B. ii) Es consecuencia de que x ∈ In equivale a que an x bn para todo n ∈ N, lo que n∈N equivale a que α x β, es decir x ∈ [α, β]. 5.19 Teorema. Dados dos números reales a < b se verifica que el intervalo [a, b] no es numerable. Demostración. Si [a, b] fuera numerable tendría que ser equipotente a N. Veamos que esto no puede ocurrir. Supongamos que ϕ : N → [a, b] es una biyección de N sobre [a, b]. En particular ϕ es sobreyectiva por lo que deberá ser [a, b] = {ϕ(n) : n ∈ N}. Obtendremos una contradicción probando que tiene que existir algún elemento z ∈ [a, b] tal que z ∈ {ϕ(n) : n ∈ N}. Para ello se procede de la siguiente forma. Dividimos el intervalo [a, b] en tres intervalos cerrados de igual longitud: a, a + b − a , a + b − a, b − b − a , b − b − a, b 3 3 3 3 y llamamos I1 al primero de ellos (es decir el que está más a la izquierda) que no contiene a ϕ(1). Dividamos ahora el intervalo I1 en tres intervalos cerrados de igual longitud y llamemos I2 al primero de ellos que no contiene a ϕ(2). Este proceso puede “continuarse indefinidamente” pues, supuesto que n ∈ N, n 2, y que tenemos intervalos cerrados de longitud positiva Ik, 1 k n, tales que Ik+1 ⊂ Ik para 1 k n − 1, y ϕ(k) ∈ Ik para 1 k n, dividimos el intervalo In en tres intervalos cerrados de igual longitud y llamamos In+1 al primero de ellos que no contiene a ϕ(n + 1). De esta forma para cada n ∈ N tenemos un intervalo cerrado In no vacío verificándose que In+1 ⊂ In y ϕ(n) ∈ In para todo n ∈ N. El principio de los intervalos encajados nos dice que hay algún número real z que está en todos los In. Por tanto, cualquiera sea n ∈ N, por ser z ∈ In y ϕ(n) ∈ In, se tiene necesariamente que z = ϕ(n), esto es, z ∈ {ϕ(n) : n ∈ N} pero, evidentemente, z ∈ [a, b]. ¿Te recuerda algo la demostración anterior? ¿Quizás a la divisibilidad infinita del continuo? Pues claro, lo que estamos haciendo es dividir infinitas veces un segmento (el prototipo de continuo). Lo que nos dice este resultado es que, aunque lo dividamos en un infinito actual de partes, siempre nos quedarán puntos que no habremos tocado. Aristóteles afirmaba que un continuo puede dividirse en cualquier parte pero no en todas partes: hay que darle la razón en este punto. 5.20 Teorema. R y R\\Q son conjuntos no numerables. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios propuestos 198 Demostración. Evidentemente todo subconjunto de un conjunto numerable también es nume- rable. Como acabamos de ver que hay subconjuntos de R que no son numerables deducimos que R no es numerable. Puesto que R = Q ∪ (R\\Q) y sabemos que Q es numerable y R no lo es, deducimos que R\\Q no es numerable. El teorema anterior demuestra no solamente que R\\Q no es vacío sino que “hay muchos más números irracionales que racionales” pues mientras que podemos enumerar los racionales no podemos hacer lo mismo con los irracionales ya que no hay biyecciones de N sobre R\\Q. Deducimos también la siguiente estrategia para probar que un conjunto A ⊂ R no es vacío es suficiente probar que su complemento R\\A es numerable (!con lo cual, de hecho, estamos probando que A es infinito no numerable!). 5.4.4. Ejercicios propuestos 172. Prueba que la aplicación F : N × N → N dada por: f (m, n) = n + (m + n − 2)(m + n − 1) para todo (m, n) ∈ N × N 2 es una biyección. Sugerencias: para cada p ∈ N definamos: ϕ(p) = ma´x q ∈ N : q < 2p + 1 + 1 4 2 Observa que ϕ(p) es un número natural mayor o igual que 2. Prueba que para todo p ∈ N se verifica: (ϕ(p) − 2)(ϕ(p) − 1) (ϕ(p) − 1)ϕ(p) 2 2 < p (∗) Definamos ahora: h(p) = p − (ϕ(p) − 2)(ϕ(p) − 1) , para todo p ∈ N 4 Justifica, teniendo en cuenta (∗), que h(p) ∈ N y ϕ(p) − h(p) 1. Comprueba finalmente que, p = F (ϕ(p) − h(p), h(p)), para cada p ∈ N. 173. Sea f : [a, b] → R creciente. Para cada α ∈]a, b[ definamos: ω(f, α) = ´ınf{f (t) : α < t b} − sup{f (s) : a s < α} Prueba que: i) ω(f, α) 0 y ω(f, α) = 0 si, y sólo si, f es continua en α. ii) Si a < α1 < α2 < · · · < αp < b, entonces: ω(f, α1) + ω(f, α2) + · · · + ω(f, αp) f (b) − f (a) Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios propuestos 199 iii) Para cada n ∈ N el conjunto Sn = {α ∈]a, b[ : ω(f, α) 1/n} es finito. iv) El conjunto S = {α ∈]a, b[ : ω(f, α) > 0} de las discontinuidades de f es numera- ble. Muestra con un ejemplo que el conjunto S puede ser infinito. 174. Prueba que el conjunto de los números algebraicos es numerable. Para terminar, recordemos que los poetas también se interesan por el infinito y lo llaman amor y también deseo. This is the monstruosity in love, lady, that the will is infinite and the execution confined, that the desire is boundless and the act a slave to limit. Shakespeare - Troilus and Cressida Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

6Cap´ıtulo Derivadas El arte de nombrar y de medir con exactitud aquello de lo que ni siquiera puede concebirse su existencia. Voltaire 6.1. Introducción Los orígenes del Cálculo estuvieron motivados por el deseo de resolver diversos problemas vinculados al movimiento de los cuerpos, así como problemas de tipo geométrico de impor- tancia en Óptica y problemas de cálculo de valores máximos y mínimos de una función dada. Simplificando, podemos destacar dos problemas principales: • Determinar la tangente a una curva en un punto (el problema de las tangentes). • Determinar el área encerrada por una curva (el problema de las cuadraturas). Son los conceptos de derivada e integral, respectivamente, los que permiten resolver satis- factoriamente dichos problemas. Mientras que el concepto de integral tiene sus raíces en la antigüedad clásica, la otra idea fundamental del Cálculo, la derivada, no se formuló hasta el siglo XVII. Fue el descubrimiento efectuado por Sir Isaac Newton (1642 - 1727) y Gottfried Wilhelm Leibniz (1646 - 1716) de la relación entre estas dos ideas, tan dispares en apariencia, lo que inició el magnífico desarrollo del Cálculo. Si bien los trabajos de Newton y Leibniz son decisivos por sus aportaciones e influencia, no hay que olvidar que ellos son el punto culmi- nante de un largo proceso en el que han participado científicos de la talla de Johannes Kepler (1571 - 1630), René Descartes (1596 - 1650), Pierre de Fermat (1601 - 1665), John Wallis (1616 -1703) e Isaac Barrow (1630 - 1677) entre otros. 200

Concepto de derivada. Interpretación física y geométrica 201 6.2. Concepto de derivada. Interpretación física y geométrica Para entender los resultados del Cálculo diferencial es necesario, antes que nada, com- prender la idea básica del mismo: el concepto de derivada. La derivada de una función puede interpretarse geométricamente como la pendiente de una curva, y físicamente como una razón “instantánea” de cambio. 6.2.1. Tangente a una curva En la primera mitad del siglo XVII no se conocían métodos generales para calcular la tangente a una curva en un punto de la misma. Este problema se presentaba con frecuencia en mecánica, en óptica y en geometría, y generalmente se resolvía, de forma geométrica, con técnicas adaptadas a cada caso particular. La dificultad está en que, siendo la tangente una recta, se precisa conocer dos puntos de la misma, o bien un punto y su pendiente, para poderla determinar. Supongamos que queremos hallar la tangente a una curva de ecuación cartesiana y = f (x) en el punto (a, f (a)). La estrategia, usada primero por Pierre de Fermat y más tarde por New- ton, consiste en aproximar la tangente por rectas secantes cuyas pendientes sí pueden calcularse directamente. En particular, consideremos la recta que une el punto (a, f (a)) con un punto cer- cano, (x, f (x)), de la gráfica de f . Esta recta se llama una secante (recta que corta a la curva, pero no es tangente a la curva). La pendiente de esta secante es: f (x) − f (a) x−a dicho número suele llamarse cociente incremental de f en a. Observa que una secante es una buena (x, f (x)) aproximación de la tangente, siempre que f (x) − f (a) el punto (x, f (x)) esté próximo a (a, f (a)). Estas consideraciones llevan a definir la tan- x−a gente a la gráfica de f en el punto (a, f (a)) como la recta que pasa por dicho punto y cuya pendiente es igual al límite: f (x) − f (a) (a, f (a)) x − a l´ım x→a supuesto, claro está, que dicho límite exis- Figura 6.1. Secante ta. 6.2.2. Razón de cambio puntual y velocidad instantánea Muchas leyes de la Física, la Química, la Biología o la Economía, son funciones que rela- cionan una variable “dependiente” y con otra variable “independiente” x, lo que suele escribirse en la forma y = f (x). Si la variable independiente cambia de un valor inicial a a otro x, la Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Razón de cambio puntual y velocidad instantánea 202 variable y lo hace de f (a) a f (x). La razón de cambio promedio de y = f (x) con respecto a x en el intervalo [a, x] es: Razón de cambio promedio = f (x) − f (a) x−a Con frecuencia interesa considerar la razón de cambio en intervalos cada vez más pequeños. Esto lleva a definir lo que podemos llamar “razón de cambio puntual de y = f (x) con respecto a x en el punto a” como: l´ım f (x) − f (a) . x − a x→a El ejemplo más conocido de esto que decimos es el de un móvil que se mueve a lo largo de una recta sobre la cual hemos elegido un origen. Sea s(t) la posición del móvil en el tiempo t, es decir, la distancia con signo del móvil al origen en el tiempo t. La razón de cambio promedio tiene en este caso una interpretación física natural: s(a + h) − s(a) h Es la velocidad media del móvil en el intervalo de tiempo comprendido entre a y a + h. Parece intuitivo que, en cada instante, el móvil se mueve con una determinada velocidad instantánea. Pero no hay manera de medir directamente una velocidad instantánea; un instante quiere decir una posición en la recta: la velocidad instantánea del móvil para t = a es la velocidad que tiene cuando está en la posición s(a). La velocidad instantánea es una abstracción de un característica física del movimiento, pero no es una magnitud que podamos observar directamente. La única definición razonable de velocidad instantánea es como la razón de cambio puntual: l´ım s(a + h) − s(a) h h→0 Notación. En lo que sigue usaremos las letras I, J para representar intervalos no vacíos de números reales. 6.1 Definición. Se dice que una función f : I → R es derivable en un punto a ∈ I, si existe el límite: l´ım f (x) − f (a) . x→a x − a Explícitamente, f es derivable en a si hay un número L ∈ R verificando que para cada número ε > 0 existe algún número δ > 0 tal que para todo x ∈ I con x = a y | x − a |< δ se tiene que: f (x) − f (a) − L ε. x−a Dicho número L se llama derivada de f en a y lo representaremos por f ′(a) (notación debida a Lagrange). La notación de Lagrange tiene la gran ventaja de poner de manifiesto que al aplicar la operación de derivación a una función obtenemos una nueva función, que está definida en todos los puntos donde la función dada sea derivable. Es usual considerar funciones derivadas definidas en intervalos. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Razón de cambio puntual y velocidad instantánea 203 6.2 Definición. Dada una función f : I → R derivable en todo punto de I, la función derivada de f es la función f ′ : I → R que a cada punto x ∈ I hace corresponder la derivada de f en dicho punto. 6.3 Observaciones. i) El límite l´ım f (x) − f (a) se puede escribir también de la forma x − a x→a l´ım f (a + h) − f (a) . h h→0 ii) La derivabilidad de f en un punto a ∈ I es una propiedad local, depende solamente del comportamiento de f en los puntos de I próximos al punto a. Concretamente, si J es cualquier intervalo abierto que contiene el punto a, se verifica que f es derivable en a si, y sólo si, la función restricción f|I∩J es derivable en a y, por supuesto, en tal caso ambas funciones tienen la misma derivada en a. La notación diferencial de Leibniz. La notación df (x) para representar la derivada de f en dx x es debida a Leibniz. Leibniz interpretaba ese símbolo como un “cociente diferencial” pues él lo entendía así: como un cociente de cantidades infinitesimales, y lo manejaba como un cociente; por ejemplo, se puede multiplicar o dividir, según convenga, por dx o df (x) . En el capítulo 5 hemos visto los problemas que planteaba el uso de cantidades infinitesimales, y cómo, finalmente, a partir del último tercio del siglo XIX, fueron totalmente abandonadas. Por eso, la interpretación de Leibniz de la derivada, aunque intuitiva, no es la que se sigue en la gran mayoría de los cursos de cálculo1. A pesar de lo dicho, es frecuente, sobre todo en libros de ingeniería, usar la notación de Leibniz y manejarla como él lo hacía. Creo que esto es útil porque la notación de Leibniz tiene una gran fuerza heurística, y no debe presentar ningún problema, siempre que no acabes creyendo que una derivada, tal como la hemos definido, es un cociente de infinitésimos. Y siempre que dicha notación se use como un mero simbolismo y no se hagan demostraciones apoyadas en su supuesta significación. Una dificultad de la notación de Leibniz es que no es cómoda para representar la derivada en un punto concreto. Podemos entender que df (x) es la función derivada f ′(x), pero ¿cómo dx df (a) df (x) indicamos la derivada en punto concreto a? Las notaciones dx y dx (a) son confusas. Lo que suele hacerse es escribir: df (x) dx x=a que, realmente, es una notación incómoda. Una posible mejora sería escribir df (x) para re- dx df presentar f ′(x), en cuyo caso dx (a) indicaría f ′(a). La verdad es que la mayoría de los libros de ingeniería que usan estas notaciones lo hacen sin preocuparse mucho por su significado, y esa es una causa importante de que muchas veces no se entienda bien lo que escriben. Las notaciones son importantes y hay que manejarlas cuidadosamente. Y todavía más, cuando una notación se supone que tiene un significado casi 1Aunque sí en los cursos de Análisis No Estándar basados en los hiperreales de A. Robinson. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Razón de cambio puntual y velocidad instantánea 204 mágico, y que por su fuerza simbólica ella sola, por sí misma, proporciona demostraciones. Volveremos a considerar este asunto más adelante. 6.4 Definición. Supuesto que f es derivable en a, la recta de ecuación cartesiana: y = f (a) + f ′(a)(x − a) se llama recta tangente a la gráfica de f en el punto (a, f (a)), y también recta tangente a f en x = a. Cuando f ′(a) = 0, la recta de ecuación: y = f (a) − f 1 (x − a) ′(a) es la recta normal a la gráfica de f en el punto (a, f (a)), y también recta normal a f en x = a 6.2.2.1. Elementos de una curva relacionados con la derivada En la figura 6.2 se han representado algunos elementos de una curva que se expresan por medio de la derivada. U H xφ P θ α y N θ OTM θ Q V Figura 6.2. Elementos de una curva relacionados con la derivada La pendiente de la tangente es tg(θ) = y ′. La pendiente de la normal es tg(α) = tg(π/2 + θ) = −1/y ′. El segmento T M es la subtangente. Su longitud viene dada por T M = y cotg(θ) = y/y ′. El segmento M N es la subnormal. Su longitud viene dada por M N = y tg(θ) = yy ′. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Derivadas laterales 205 Los segmentos interceptados en los ejes OX y OY por la tangente son OT = OM − T M = x − y/y ′ OV = P M − P Q = y − x tg(θ) = y − xy ′ Los segmentos interceptados en los ejes OX y OY por la normal son ON = OM + M N = x + y tg(θ) = x + yy ′ OU = OH + HU = y + x tg(φ) = y + x tg(π/2 − θ) = y + x/y ′ 6.2.3. Derivadas laterales 6.5 Definición. Se dice que f es derivable por la izquierda en a si existe el límite: xl´ı→ma f (x) − f (a) . x − a x<a El valor de dicho límite se llama la derivada por la izquierda de f en a. Análogamente se dice que f es derivable por la derecha en a, si existe el límite: xl´ı→ma f (x) − f (a) . x − a x>a El valor de dicho límite se llama la derivada por la derecha de f en a. Teniendo en cuenta la relación que hay entre el límite de una función en un punto y los límites laterales, es claro que: i) Si a = ma´x I, entonces la derivabilidad de f en a es lo mismo que la derivabilidad por la izquierda de f en a. ii) Si a = m´ın I, entonces la derivabilidad de f en a es lo mismo que la derivabilidad por la derecha de f en a. iii) Si a no es un extremo de I, entonces equivalen las afirmaciones: a) f es derivable en a. b) Las derivadas por la izquierda y por la derecha de f en a existen y coinciden. 6.2.4. Propiedades de las funciones derivables. Reglas de derivación El siguiente resultado nos dice que la derivabilidad es una propiedad más fuerte que la continuidad. 6.6 Proposición. Toda función derivable en un punto es continua en dicho punto. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Propiedades de las funciones derivables. Reglas de derivación 206 Demostración. En efecto, si f : I → R es derivable en a, de la igualdad: f (x) = f (a) + (x − a) f (x) − f (a) (x ∈ I, x = a) x − a se sigue que l´ım f (x) = f (a), es decir, f es continua en a. x→a 6.7 Teorema (Reglas de derivación). Sean f, g : I → R dos funciones. Se verifican las si- guientes afirmaciones: i) La funciones suma, f + g, y producto, f g, son derivables en todo punto a ∈ I en el que f y g sean derivables, y las derivadas respectivas vienen dadas por: (f + g)′(a) = f ′(a) + g ′(a); (f g)′(a) = f ′(a)g(a) + f (a)g ′(a) ii) Si g(x) = 0 para todo x ∈ I, la función cociente f /g es derivable en todo punto a ∈ I en el que f y g sean derivables, en cuyo caso se verifica que: f ′ f ′(a)g(a) − f (a)g ′(a) g (g(a))2 (a) = Demostración. Las reglas de derivación se prueban muy fácilmente haciendo uso de las propie- dades algebraicas de los límites y la definición de derivada. Es suficiente que tengas en cuenta las siguientes igualdades: (f + g)(x) − (f + g)(a) = f (x) − f (a) + g(x) − g(a) x−a x − a x − a (f g)(x) − (f g)(a) = f (x) − f (a) g(x) + f (a) g(x) − g(a) x−a x − a x − a 1 (x) − 1 (a) = − g(x) − g(a) 1 g g x − a g(x)g(a) x−a De la primera y segunda igualdades se deduce, tomando límites para x → a , las reglas para la derivada de una suma y de un producto. Igualmente, de la tercera igualdad, se deduce la derivada de 1 , de donde, se obtiene la derivada de f = f 1 haciendo uso de la regla para g g g derivar un producto. Como las funciones constantes tienen derivada nula en todo punto y la función identidad, f (x) = x, tiene derivada igual a 1 en todo punto, aplicando las reglas de derivación anteriores se obtiene el siguiente corolario. 6.8 Corolario. Las funciones polinómicas son derivables en todo punto y las funciones racio- nales son derivables en todo punto de su conjunto natural de definición. Además la derivada de la función polinómica f (x) = a0 + a1x + a2x2 + · · · + anxn en cada punto x ∈ R viene dada por: f ′(x) = a1 + 2a2x + 3a3x2 + · · · + nanxn−1 Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Propiedades de las funciones derivables. Reglas de derivación 207 6.9 Teorema (Derivación de una función compuesta o regla de la cadena). Sean f : I → R y g : J → R con f (I) ⊂ J, y sea h = g◦f : I → R la función compuesta. Supongamos que f es derivable en a ∈ I y que g es derivable en f (a). Entonces h es derivable en a y h′(a) = g ′(f (a))f ′(a). En particular, si g es derivable en J, la función compuesta h = g◦f es derivable en todo punto de I donde f sea derivable. Demostración. Pongamos b = f (a). Tenemos que probar que l´ım h(x) − h(a) = g ′(b)f ′(a). x − a x→a Por hipótesis se cumple que : l´ım g(y) − g(b) l´ım f (x) − f (a) = g ′(b)f ′(a) y − b x − a y→b x→a La idea de la demostración es hacer en esta igualdad la sustitución y = f (x). Como no está garantizado por las hipótesis hechas que para x = a se tenga f (x) = b, no está justificado hacer directamente la sustitución indicada (dividir por cero está prohibido). Podemos evitar esta dificultad como sigue. Definamos la función ϕ : J → R por: ϕ(y) = g(y) − g(b) (y = b), ϕ(b) = g ′(b) y−b Con ello la función ϕ es continua en b. Es inmediato ahora comprobar que para todo x ∈ I con x = a se verifica que: h(x) − h(a) = ϕ(f (x)) f (x) − f (a) . (6.1) x − a x − a Ahora, como f es continua en a (porque es derivable en a) y ϕ es continua en b = f (a), se sigue que ϕ ◦ f es continua en a, por lo que: l´ım ϕ(f (x)) = ϕ(f (a)) = ϕ(b) = g ′(b). x→a La igualdad (6.1) nos dice ahora que: l´ım h(x) − h(a) = g ′(b)f ′(a) x − a x→a como queríamos probar. Regla de la cadena al estilo Leibniz. Una demostración de la regla de la cadena al “estilo Leibniz” podría ser como sigue. Por una parte, tenemos que y es función de x a través de g, es decir, y = g(x). También tenemos que x es función de t a través de f , x = f (t). Entonces la variación de y respecto a t se hace por intermedio de x: dy = dy dx (6.2) dt dx dt Hemos acabado. Todo lo que hemos hecho ha sido multiplicar y dividir por dx . No sé lo que pensará tú de esto, pero a mí me parecería una broma que alguien pretendiera que lo que hemos hecho es una demostración. Primero: ¿qué es dx ? Porque si es un símbolo, Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Propiedades de las funciones derivables. Reglas de derivación 208 no tiene sentido multiplicar y dividir por él (salvo que a esta operación se le hubiera asignado previamente un significado preciso) y si es un número ¿cómo está definido? ¿qué relación tiene ese número con la derivada? Preguntas sin respuesta. A esto me refería al decir que una notación, por sí sola, no sirve para demostrar nada. Además, el simbolismo empleado en la igualdad (6.2) no indica dónde se evalúa cada una de las derivadas, y eso es fundamental para entender la regla de la cadena. Fíjate que la regla de la cadena nos dice que la derivada de una función compuesta de dos funciones derivables, h(x) = (g ◦ f )(x), viene dada por h′(x) = g ′(f (x))f ′(x) = (g ′ ◦ f )(x)f ′(x) (6.3) que es un producto de dos funciones, g ′(f (x)) y f ′(x), pero la primera de ellas g ′(f (x)) = (g ′ ◦ f )(x) es una función compuesta. Por eso si queremos volver a derivar en la igualdad (6.3), debemos aplicar la regla para derivar un producto y, para derivar el primer factor, debemos aplicar la regla de la cadena. Es por eso que, en la regla de la cadena, es fundamental indicar los puntos donde se evalúan las derivadas. La notación en la igualdad (6.2) es mala porque no indica dónde se evalúa cada una de las derivadas. Pero también es mala por las razones siguientes. • Una misma letra representa dos funciones distintas. En (6.2) la letra y aparece a la izquierda y a la derecha. A la izquierda representa la función compuesta y = g(f (t)), a la derecha representa la función y = g(x). • Una misma letra representa una función y una variable. La letra x en la parte derecha representa la variable en y = g(x), y también representa la función x = f (t). Demasiado confuso ¿verdad? A pesar de lo dicho, la igualdad (6.2) aparece en muchos textos de matemáticas para ingenieros y en textos de física, sin ningún comentario, sin explicar lo que significa y pretendiendo que constituye por sí misma una demostración. Lo peor de todo, es que si te la enseñan así puedes creer que la entiendes, y entonces una de dos: o la entiendes de verdad, como acabo de explicarlo, o te engañas y realmente no sabes lo que crees saber. Lamentablemente, de estas dos posibilidades la más frecuente es la segunda. Y. . . sin embargo, la igualdad (6.2) es muy simple y fácil de recordar, y permite conjeturar la regla de la cadena sin necesidad de demostrarla (por eso decimos que la notación de Leibniz tiene un gran valor heurístico). Mi consejo es el siguiente: puedes usar la notación de Leibniz siempre que te ayude en lo cálculos, pero no debes dejarte llevar por la notación sino que debes entender lo que estás haciendo en cada momento. 6.10 Ejemplo. Sabiendo que y = sen x y x = cos t, se pide calcular la derivada de y con respecto a t. Lo que nos piden es calcular la derivada de la función compuesta h(t) = sen(cos t). Aquí g(x) = sen x, f (t) = cos t. Tenemos que h′(t) = g ′(f (t))f ′(t) = − cos(cos t) sen t Al estilo Leibniz: dy = dy dx = cos x(− sen t) = − cos x sen t dt dx dt Pero esta igualdad debe ser función de t por lo que hay que sustituir x = cos t y se vuelve a obtener el resultado anterior. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios propuestos 209 6.2.5. Ejercicios propuestos Empezaremos con algunas de las aplicaciones más sencillas y atractivas del cálculo diferencial. En esquema, se trata de lo siguiente: calcular la tasa de variación de una magnitud cuando se conoce la tasa de variación de otra magnitud relacionada con ella. En este tipo de ejercicios la “tasa de variación” se interpreta como una derivada y, en la mayoría de los casos, basta usar la regla de la cadena para obtener lo que se pide. Hay que elegir las unidades de acuerdo con los datos del problema; por ejemplo, si un volumen se mide en litros tendremos que medir longitudes con decímetros. 175. ¿Con qué rapidez baja el nivel del agua contenida en un depósito cilíndrico si estamos vaciándolo a razón de 3000 litros por minuto? 176. Se está llenando un globo de forma esférica con gas a razón de 50cm3/s. Calcula la velocidad a la que está aumentando el radio, r, del globo cuando su valor es r = 5. 177. Un punto P se mueve sobre la parte de la parábola x = y2 situada en el primer cuadrante de forma que su coordenada x está aumentando a razón de 5cm/sg. Calcula la velocidad a la que el punto P se aleja del origen cuando x = 9. 178. Se está llenando un depósito cónico apoyado en su vértice a razón de 9 litros por segundo. Sabiendo que la altura del depósito es de 10 metros y el radio de la tapadera de 5 metros, ¿con qué rapidez se eleva el nivel del agua cuando ha alcanzado una profundidad de 6 metros? 179. El volumen de un cubo está aumentando a razón de 70cm3 por minuto. ¿Con qué rapidez está aumentando el área cuando la longitud del lado es de 12cm? 180. Un barco A se desplaza hacia el oeste con una velocidad de 20 millas por hora y otro barco B avanza hacia el norte a 15 millas por hora. Ambos se dirigen hacia un punto O del océano en el cual sus rutas se cruzan. Sabiendo que las distancias iniciales de los barcos A y B al punto O son, respectivamente, de 15 y de 60 millas, se pregunta: ¿A qué velocidad se acercan (o se alejan) los barcos entre sí cuando ha transcurrido una hora? ¿Y cuando han transcurrido 2 horas? ¿En qué momento están más próximos uno de otro? 181. Una bola esférica de hielo se está derritiendo de forma uniforme en toda la superficie, a razón de 50cm3 por minuto. ¿Con qué velocidad está disminuyendo el radio de la bola cuando este mide 15cm? 182. Un hombre se aleja de una farola a razón de 1,5m/sg. Sabiendo que la altura del hom- bre es de 1,8 metros y la de la farola de 15 metros, calcula la velocidad a la que está aumentando la sombra del hombre proyectada por la luz. 183. Un faro, cuya linterna gira a 8 revoluciones por minuto, se encuentra situado a 3 kilóme- tros de una costa rectilínea. Calcula la velocidad con que el rayo de luz recorre la orilla cuando el ángulo de incidencia del rayo de luz con la línea de la costa es de 45 grados. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios propuestos 210 Los siguientes ejercicios son de cálculo de derivadas y de tangentes y normales a distin- tas curvas. Cuando en un ejercicio intervienen parámetros, debes expresar las soluciones de la forma más sencilla posible. 184. Calcula (f ◦ g)′(x) en el valor indicado de x en los siguientes casos: 1. f (x) = 2x 1 , g(x) = 10x2 + x + 1, x=0 x2 + 2. f (x) = x−1 2 g(x) = 1 − 1, x = −1 x+1 x2 , 185. Calcula en cada caso el valor de a y b en función de c, para que exista la derivada en el punto c de cada una de las siguientes funciones: f (x) = x2, x c f (x) =  1 , |x| > c f (x) = cos x, x c ax + b, x > c  |x| |x| c ax + b, x > c  a + bx2, 186. Supongamos que f es derivable en a, g es continua en a y f (a) = 0. Prueba que f g es derivable en a. 187. ¿Es cierta la igualdad f ′(a) = l´ım f (a + t) − f (a − t) ? Justifica tu respuesta. 2t t→a 188. Supongamos que las funciones f y g y sus derivadas tienen los siguientes valores en x = 2 y x = 3. x f (x) g(x) f ′(x) g′(x) 2 8 2 1/3 -3 3 3 -4 2π 5 Calcular las derivadas de las siguientes funciones en los valores dados de x: a) f (x)g(x), x = 3 b) f (x)/g(x), x = 3 c) f (g(x)), x = 2 d) (f (x))2 + (g(x))2, x = 2 189. Supongamos que las funciones f y g y sus derivadas tienen los valores que se indican en la tabla. x f (x) g(x) f ′(x) g′(x) 0 1 5 2 -5 1 3 -2 0 1 20 2 3 1 3 2 4 1 -6 Calcula una tabla análoga para las funciones f ◦ g y g ◦ f . 190. Calcula directamente, aplicando la definición, la derivada de f (x) = x3 en un punto genérico a. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios propuestos 211 √ 191. Calcula directamente, aplicando la definición, la derivada de f (x) = x + 7 en el punto a = −1. 192. Supongamos que f es una función que verifica una desigualdad del tipo |f (x)| |x|r en algún intervalo abierto que contiene a cero, donde r > 1. Prueba que f es derivable en 0. 193. Sea f una función tal que f (x + h) = f (x) + 3xh + h2 − 2h para todos x, h ∈ R. Calcula f ′(0) y f ′(2). 194. Calcula la derivada en todo punto de la función definida por f (x) = x2 sen 1 , x=0 x 0, x = 0 195. Desarrolla (1 + x)n por el binomio de Newton y deriva la igualdad resultante para probar las igualdades siguientes: n k n = n2n−1, n k(k − 1) n = n(n − 1)2n−2 k k k=1 k=2 196. Calcula los puntos en que la cúbica de ecuación y = ax3 + bx2 + cx + d, donde a, b, c, d son constantes reales, tiene tangente horizontal. Debes estudiar los distintos casos posi- bles. 197. Calcula un punto c por la condición de que la tangente a la parábola f (x) = x2 + αx + β en el punto (c, f (c)), sea paralela a la cuerda que une dos puntos dados A = (a, f (a)) y B = (b, f (b)). 198. Calcula las ecuaciones de las rectas tangente y normal a una parábola f (x) = ax2+bx+c en un punto genérico (u, v) de la misma. 199. Calcula las ecuaciones de las rectas tangente y normal a una hipérbola de ecuación car- tesiana x2 − y2 = 1, en un punto genérico (u, v) de la misma. 200. Calcula las ecuaciones de las rectas tangente y normal a una elipse de ecuación x2 + y2 = 1 a2 b2 en un punto (u, v) de la misma. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios resueltos 212 6.2.6. Ejercicios resueltos ¡Antes de ver la solución de un ejercicio debes intentar resolverlo! Ejercicio resuelto 79 ¿Con qué rapidez baja el nivel del agua contenida en un depósito ci- líndrico si estamos vaciándolo a razón de 3000 litros por minuto? Solución. Sea r el radio del cilindro y h la altura medidos en decímetros. Sea V (t) el volumen de agua, medido en litros (dcm3), que hay en el cilindro en el tiempo t medido en minutos. La información que nos dan es una tasa de variación V (t + 1) − V (t) = −3000 litros por minuto En este tipo de ejercicios la tasa de variación se interpreta como una derivada: V ′(t) = −3000. Fíjate que V (t+t0)−V (t0) ≅ V ′(t0)t, por lo que la interpretación es razonable. El signo negativo de la derivada es obligado ya que el volumen disminuye con el tiempo. Como el radio es constante pero la altura del agua depende del tiempo, tenemos V (t) = πr2h(t) y deducimos V ′(t) = −3000 = πr2h′(t) Por tanto 3000 π r2 h ′ (t) = − decímetros por minuto Si expresamos las medidas en metros, entonces h ′ (t) = − 3 metros por minuto. πr2 Observa que lo que realmente hemos calculado es: V (t+1)−V (t) = πr2(h(t+1)−h(t)) −→ h(t+1)−h(t) = V (t + 1) − V (t) = − 3000 πr2 π r2 que es la tasa de variación de la altura en un intervalo de 1 minuto. Pero, como ya te he dicho, en estos ejercicios se identifica la tasa de variación con una derivada, lo cual es, claro está, una aproximación. Ejercicio resuelto 80 Un punto P se mueve sobre la parte de la parábola x = y2 situada en el primer cuadrante de forma que su coordenada x está aumentando a razón de 5cm/sg. Calcular la velocidad a la que el punto P se aleja del origen cuando x = 9. Solución. Sean (x(t), y(t)) las coordenadas, medidas en centímetros, del punto P en el instante t medido en segundos. Nos dicen que y(t) 0 y que x(t) = y(t)2. La distancia del punto P al origen viene dada por f (t) = x(t)2 + y(t)2, por lo que f ′(t) = x(t)x′(t) + y(t)y ′(t) x(t)2 + y(t)2 Lo que nos piden es f ′(t0) sabiendo que x(t0) = 9. En tal caso ha de ser y(t0) = 3. También conocemos x′(t) = 5 (cm/sg). Con ello es fácil deducir el valor de y ′(t0) = Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios resueltos 213 x ′(t0) = 5 . Finalmente, 2y(t0) 6 f ′(t0) = x(t0)x′(t0) + y(t0)y ′(t0) = 45 + 3(5/6) = √95 cm/sg x(t0)2 + y(t0)2 81 + 9 6 10 Ejercicio resuelto 81 Se está llenando un depósito cónico apoyado en su vértice a razón de 9 litros por segundo. Sabiendo que la altura del depósito es de 10 metros y el radio de la tapadera de 5 metros, ¿con qué rapidez se eleva el nivel del agua cuando ha alcanzado una profundidad de 6 metros? Solución. Expresaremos todas las medidas en metros. Si V (t) es el volumen de agua 9 que hay en el depósito en el tiempo t medido en segundos, nos dicen que V ′(t) = 103 m3/sg. R Sabemos que V (t) = 1 π r(t)2h(t) donde h(t) es H 3 la altura, medida desde el vértice, alcanzada por el agua en el tiempo t y r(t) es el radio de la sec- r ción transversal del cono a la distancia h(t) desde el h vértice. Por semejanza de triángulos deducimos que Figura 6.3. Depósito cónico r = h , de donde, r = r(t) = R h(t) = 1 h(t). R H H 2 Luego V (t) = 1 π h(t)3, y 12 V ′(t) = 9 = π h(t)2 h ′ (t). 103 4 9 π 1 Luego, cuando h(t0) = 6, deducimos que 103 = 4 36h ′ (t0), esto es, h ′(t0) = 103π m/sg ≅ 1, 146 m/h. Ejercicio resuelto 82 El volumen de un cubo está aumentando a razón de 70 cm3 por minuto. ¿Con qué rapidez está aumentando el área cuando la longitud del lado es de 12 cm? Solución. Sea V (t) el volumen del cubo, medido en centímetros cúbicos, en el tiempo t, medido en minutos. Si L(t) es la longitud en centímetros del lado en el tiempo t, tenemos V ′(t) que V (t) = L(t)3, de donde, L ′(t) = 3L(t)2 . Como nos dicen que V ′(t) = 70 cm/min, deducimos que cuando L(t0) = 12, L ′(t0) = 70 El área del cubo viene dada por 3(12)2 . 70 S(t) = 6L(t)2, deducimos que S ′(t0) = 12L(t0 )L ′(t0 ) = 3 cm2/min. Ejercicio resuelto 83 Un barco A se desplaza hacia el oeste con una velocidad de 20 millas por hora y otro barco B avanza hacia el norte a 15 millas por hora. Ambos se dirigen hacia un punto O del océano en el cual sus rutas se cruzan. Sabiendo que las distancias iniciales de los barcos A y B al punto O son, respectivamente, de 15 y de 60 millas, se pregunta: ¿A qué velocidad se acercan (o se alejan) los barcos entre sí cuando ha Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios resueltos 214 transcurrido una hora? ¿Y cuando han transcurrido 2 horas? ¿En qué momento están más próximos uno de otro? Solución. Tomamos el punto O como origen de coordenadas, tal como se indica en la figura. Llamemos x(t) a la distancia, medida en millas, que separa el barco A de O. Nos dicen que x(0) = 15 y x′(t) = −20 millas por hora. Observa que como la función x(t) es decreciente su derivada debe ser negativa. Análogamente, sea y(t) la distancia que separa al barco B de O. Nos dicen que y(0) = 60 y y ′(t) = −15 millas por hora. La distancia entre los dos barcos viene dada O A por f (t) = x(t)2 + y(t)2. Tenemos f ′(t) = x(t)x′(t) + y(t)y ′(t) x(t)2 + y(t)2 Cuando ha pasado una hora x(1) = 15 − 20 = −5, y(1) = 60 − 15 = 45. Deducimos que B f ′(1) = (−5)(−20) + 45(−15) = − √115 millas/h Figura 6.4. Cruce de barcos (−5)2 + (45)2 82 Donde el sigo negativo indica que se están acercan- do (la distancia entre ellos está disminuyendo). Cuando han pasado dos horas x(2) = 15 − 40 = −25, y(2) = 60 − 30 = 30. Deducimos que f ′(2) = (−25)(−20) + 30(−15) = √10 millas/h (−25)2 + (30)2 61 Donde el sigo positivo indica que se están alejando (la distancia entre ellos está aumen- tando). La distancia entre los dos barcos es mínima cuando la derivada es nula (fíjate que la derivada pasa de negativa a positiva). La condición f ′(t0) = 0 equivale a la igualdad −20 x(t0) − 15y(t0) = 0. Sustituyendo en ella x(t0) = 15 − 20 t0, y(t0) = 60 − 15 t0, 48 48 117 48 156 obtenemos t0 = 25 . x( 25 ) = − 5 , y( 25 ) = 5 . La distancia mínima a que se cruzan los barcos es f ( 48 ) = 39 millas. 25 Ejercicio resuelto 84 Una bola esférica de hielo se está derritiendo de forma uniforme en toda la superficie, a razón de 50 cm3 por minuto. ¿Con qué velocidad está disminuyendo el radio de la bola cuando este mide 15 cm? Solución. El volumen de la bola en el instante t minutos viene dado por V (t) = 4 π r(t)3 3 centímetros cúbicos. Nos dicen que V ′(t) = −50. Deducimos que −50 = 4 π r(t)2r ′(t). Si r(t0) = 15, se sigue que r ′(t0) = −50 = − 1 cm/min 4 π(15)2 18 π La derivada es negativa, como debe ser, ya que el radio está disminuyendo. Ejercicio resuelto 85 Calcula (f ◦ g)′(x) en el valor indicado de x en los siguientes casos: Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios resueltos 215 a) f (x) = 2x 1 , g(x) = 10x2 + x + 1, x=0 x2 + b) f (x) = x−1 2 g(x) = 1 − 1, x = −1 x+1 x2 , Solución. Este ejercicio lo puedes hacer de dos formas: calculando en caso la función compuesta (f ◦ g)(x) y derivándola, o aplicando la regla de la cadena sin necesidad de calcular previamente la función compuesta. Esta segunda forma es mucho más rápida. Las derivadas que nos piden son las siguientes. a) f ′(x) = 2 − x2 , g ′(x) = 20x + 1 −→ (f ◦ g)′(0) = f ′(g(0))g ′(0) = (x2 + 1)2 1 f ′(1)g ′(0) = 4 . El otro apartado se hace igual. Ejercicio resuelto 86 Calcula en cada caso el valor de a y b en función de c, para que exista la derivada en el punto c de cada una de las siguientes funciones:  1  |x| f (x) = x2, x c f (x) =  , |x| > c f (x) = cos x, x c ax + b, x > c |x| c ax + b, x > c a + bx2, Solución. Consideremos la segunda de las funciones anteriores. Tenemos que f (x) = 1 |x| para x < −c o x > c, y f (x) = a + bx2 para −c x c. Imponemos primero la condición de que f sea continua en c. Tenemos que f (c) = a + bc2 = xl´ı→mc f (x), y x<c 1 1 1 xl´ı→mc f (x) = |c| = c . Debemos imponer la condición a + bc2 = c . Impondremos también x>c la condición de que los límites laterales en c de la derivada de f coincidan. Para x > c es f (x) = 1 , por lo que x xl´ı→mc f ′(x) = xl´ı→mc − 1 = − 1 . x2 c2 x>c x>c Análogamente xl´ı→mc f ′(x) = xl´ı→mc 2bx = 2bc. x<c x<c Debemos imponer la condición 2bc = − 1 . Deducimos que b = − 1 ya = −bc2 + 1 = c2 2c3 c 3 2c . Observa que las condiciones que hemos obtenido son necesarias para que f sea derivable en c. Pero dichas condiciones también son suficientes como consecuencia de la proposi- ción 6.19. No es necesario, por ello, que comprobemos que, con los valores de a y de b obtenidos antes, efectivamente f es derivable en c. Las otras dos funciones se estudian de la misma forma. Ejercicio resuelto 87 ¿Es cierta la igualdad f ′(a) = l´ım f (a + t) − f (a − t) Justifica tu 2t ? t→a respuesta. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios resueltos 216 Solución. Tenemos que f (a + t) − f (a − t) = f (a + t) − f (a) + f (a) − f (a − t) = 2t 2t 2t = 1 f (a + t) − f (a) + 1 f (a − t) − f (a) 2 t 2 −t Y basta tener en cuenta que: l´ım f (a + t) − f (a) = l´ım f (a − t) − f (a) = f ′(a) t −t t→a t→a Ejercicio resuelto 88 Supongamos que las funciones f y g y sus derivadas tienen los si- guientes valores en x = 2 y x = 3. x f (x) g(x) f ′(x) g′(x) 2 8 2 1/3 -3 3 3 -4 2π 5 Calcular las derivadas de las siguientes funciones en los valores dados de x: a) f (x)g(x), x = 3 b) f (x)/g(x), x = 3 c) f (g(x)), x = 2 d) (f (x))2 + (g(x))2, x = 2 Solución. a) (f g)′(3) = f ′(3)g(3) + f (3)g ′(3) = −8π + 15. f ′ f ′(3)g(3) − f (3)g ′(3) −8π − 15 g g(3)2 16 . b) (3) = = c) (f ◦ g)′(2) = f ′(g(2))g ′(2) = f ′(2)g ′(2) = −1. d) h(x) = (f (x))2 + (g(x))2, h′(2) = f ′(2)f (2) + g ′(2)g(2) = − √5 . (f (x))2 + (g(x))2 3 17 Ejercicio resuelto 89 Supongamos que f es una función que verifica una desigualdad del tipo |f (x)| |x|r en algún intervalo abierto que contiene a cero, donde r > 1. Prueba que f es derivable en 0. Solución. La desigualdad |f (x)| |x|r, con r > 0, implica que f (0) = 0. Tenemos que f (x) − f (0) = f (x) |x|r−1 x−0 x Como r − 1 > 0, se tiene que l´ım |x|r−1 = 0, lo que, por la desigualdad anterior, implica que x→0 l´ım f (x) − f (0) =0 ⇐⇒ l´ım f (x) − f (0) = 0. x−0 x − 0 x→0 x→0 Luego f es derivable en 0 y f ′(0) = 0. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios resueltos 217 Ejercicio resuelto 90 Calcula la derivada en todo punto de la función definida por f (x) = x2 sen 1 , x=0 x 0, x = 0 Solución. Para x = 0 se verifica que |f (x)| = x2 sen 1 x2. Como f (0) = 0, resulta x que |f (x)| x2 para todo x ∈ R. El ejercicio anterior implica que f es derivable en 0 con f ′(0) = 0. En los intervalos ] − ∞, 0[ y ]0, +∞[ la función dada es derivable por ser producto y composición de funciones derivables en dichos intervalos, y podemos calcular su derivada con las reglas de derivación usuales: f ′(x) = 2x sen 1 − cos 1 x x Observa que esta derivada tiene una discontinuidad esencial en 0. Ejercicio resuelto 91 Calcula los puntos en que la cúbica y = ax3 + bx2 + cx + d, donde a, b, c, d son constantes reales, tiene tangente horizontal. Debes estudiar los distintos casos posibles. Solución. La tangente es horizontal en los puntos donde se anula la derivada, esto es, en las soluciones reales de la ecuación 3ax2 + 2bx + c = 0, las cuales viene dadas por √ −2b ± 4b2 − 12ac 6a Si el discriminante 4b2 − 12ac < 0 no hay ninguna solución real. Si 4b2 − 12ac = 0 hay una solución real doble (en la que también se anula la derivada segunda pero no se anula la derivada tercera, es un punto de inflexión). Si 4b2 − 12ac > 0 hay dos puntos de tangencia horizontal. Ejercicio resuelto 92 Calcula un punto c por la condición de que la tangente a la parábola f (x) = x2 + αx + β en el punto (c, f (c)), sea paralela a la cuerda que une dos puntos dados A = (a, f (a)) y B = (b, f (b)). Solución. Dos rectas en el plano son paralelas cuando tienen igual pendiente. Debemos calcular c por la condición f (b) − f (a) = f ′(c) ⇐⇒ b2 − a2 + α(b − a) = 2c+α ⇐⇒ b+a+α = 2c+α ⇐⇒ c= a+b b−a b−a 2 Ejercicio resuelto 93 Calcula las ecuaciones de las rectas tangente y normal a una hipérbola de ecuación cartesiana y2 − x2 = 1, en un punto genérico (u, v) de la misma. Solución. Podemos expresar√y como función de x. Tenemos que y2 = 1 + x2, lo que da lugar a dos curvas √f (x) = 1 + x2 (la parte de la hipérbola en el semiplano superior y > 0) y g(x) = − 1 + x2 (la parte de la hipérbola en el semiplano inferior y < 0). La tangente en un punto (u, v) con v = f (u) > 0 es la recta de ecuación: y = f (u) + f ′(u)(x − u) = v + √ u (x − u) = v + ux − u2 ⇐⇒ vy − ux = 1 1 + u2 v Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Ejercicios resueltos 218 La tangente en un punto (u, v) con v = g(u) < 0 es la recta de ecuación: y = g(u) + g ′(u)(x − u) = v − √ u (x − u) = v + ux − u2 ⇐⇒ vy − ux = 1 1 + v u2 En cualquier caso se obtiene la recta de ecuación vy − ux = 1. Podemos proceder también sin necesidad de calcular y en función de x. Para ello, basta observar que si expresamos y en función de x y obtenemos y = ϕ(x) entonces se tiene que ϕ(x)2 − x2 = 1. Podemos derivar ahora la función x → ϕ(x)2 − x2 con respecto a x. La derivada es 2ϕ(x)ϕ′(x) − 2x y, como dicha función es constante igual a 1, su derivada debe ser nula. Luego 2ϕ(x)ϕ′(x) − 2x = 0 ⇐⇒ ϕ ′ (x) = x ϕ(x) Por tanto la derivada en un punto u viene dada por ϕ ′ (u) = u donde v = ϕ(u). En v consecuencia, la tangente en el punto (u, v) es la recta de ecuación: y = v + ϕ ′ (u)(x − u) = v + u (x − u) = v + ux − u2 ⇐⇒ vy − ux = 1 v v Es decir, de esta forma, sin necesidad de calcular de forma explícita ϕ(x) (que da lu- gar a las dos funciones anteriores f (x) y g(x)), podemos calcular la recta tangente sin necesidad de considerar cada caso por separado. Para que te convenzas de que esta forma de proceder es útil, considera la hipérbola x2 − √y2 = 1. Si ahora√expresas y como función de x√ obtendrás cuatro√curvas: y1 = x2 − 1 e y2 = − x2 − 1 para (x > 1), y y3 = x2 − 1 e y4 = − x2 − 1 para (x < −1). Para calcular la tangente en un punto (u, v) de dicha hipérbola no mere- ce la pena considerar cada una de ellas por separado. Razonando como antes, se tiene que de cualquier forma que expresemos y = ϕ(x) por la condición de que x2 − ϕ(x)2 = 1, la derivada viene dada por ϕ′(x) = x/ϕ(x). Por tanto la ecuación de la recta tangente en (u, v) viene dada por: y = v + ϕ ′ (u)(x − u) = v + u (x − u) = v + ux − u2 ⇐⇒ ux − vy = 1 v v Ejercicio resuelto 94 Calcula las ecuaciones de las rectas tangente y normal a una elipse de ecuación x2 + y2 = 1 en un punto (u, v) de la misma. a2 b2 Solución. Procediendo como en el ejercicio anterior debes obtener la recta de ecuación ux + vy = 1 a2 b2 Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Derivabilidad de las funciones elementales 219 6.2.7. Derivabilidad de las funciones elementales 6.2.7.1. Derivabilidad de la exponencial y del logaritmo. Criterio de equivalencia loga- rítmica Aceptaremos que las funciones logaritmo, exponencial, trigonométricas y sus inversas, son derivables, pues ahora no sería fácil probarlo. Más adelante dispondremos de herramientas para hacerlo con comodidad. La función exponencial x → exp(x) = ex, (x ∈ R), y la función logaritmo natural x → log x, (x ∈ R+), son derivables en todo punto de sus respectivos intervalos de definición, siendo: 1 x (exp)′(x) = exp x (∀x ∈ R), (log)′(x) = (∀x ∈ R+) En particular, se verifica que: l´ım log x = 1; l´ım ex −1 = 1; l´ım log(1 + x) = 1; l´ım (1 + x)1/x = e x−1 x x x→1 x→0 x→0 x→0 Pues los primeros tres límites son derivadas y el cuarto se reduce fácilmente al tercero. Dedu- cimos también un importante resultado que permite resolver en muchos casos las indetermina- ciones “1∞” y “0∞”. 6.11 Teorema (Criterio de equivalencia logarítmica). Sea a ∈ I, f y g funciones definidas en I \\ {a}. Supongamos que f (x) > 0 para x ∈ I \\ {a}, y que l´ım f (x) = 1. Entonces se tiene x→a que: i) l´ım f (x)g(x) = eL si, y sólo si, l´ım g(x)(f (x) − 1) = L. x→a x→a ii) l´ım f (x)g(x) = +∞ si, y sólo si, l´ım g(x)(f (x) − 1) = +∞. x→a x→a iii) l´ım f (x)g(x) = 0 si, y sólo si, l´ım g(x)(f (x) − 1) = −∞. x→a x→a Demostración. Sea ϕ : R+ → R la función dada por: ϕ(x) = log x , (x = 1), ϕ(1) = 1. x−1 Nótese que ϕ es una función continua. Pongamos: f (x)g(x) = exp g(x) log(f (x)) = exp g(x)(f (x) − 1)ϕ(f (x)) Puesto que l´ım ϕ(f (x)) = 1 se sigue que: x→a l´ım g(x)(f (x) − 1)ϕ(f (x)) = L ∈ R ∪ {+∞} ∪ {−∞} x→a si, y sólo si l´ım g(x)(f (x) − 1)) = L ∈ R ∪ {+∞} ∪ {−∞} x→a lo que prueba las afirmaciones hechas. Las afirmaciones que se hacen en la siguiente proposición son consecuencia fácil de la regla de la cadena. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Derivabilidad de las funciones elementales 220 6.12 Proposición. Sean f, g : I → R, a ∈ I y g(x) > 0 para todo x ∈ I. Se verifica entonces que: i) f es derivable en a si, y sólo si, la función h(x) = exp(f (x)) es derivable en a en cuyo caso h′(a) = f ′(a) exp(f (a)). ii) g es derivable en a si, y sólo si, la función ϕ(x) = log(g(x)) es derivable en a en cuyo caso g ′(a) ϕ ′ (a) = g(a) . iii) Si f y g son derivables en a la función ψ(x) = g(x)f(x) también es derivable en a y ψ ′(a) = ψ(a) log(g(a))f ′ (a) + f (a) g ′(a) g(a) Te recuerdo que una forma cómoda para trabajar con funciones de la forma ψ(x) = g(x)f(x) es escribirlas como exponenciales ψ(x) = exp f (x) log(g(x)) . 6.2.7.2. Derivabilidad de las funciones trigonométricas Las funciones seno y coseno son derivables en todo punto verificándose que: sen ′(x) = cos x cos ′(x) = − sen x. En particular, se verifica que: l´ım sen x = 1, l´ım cos x− 1 = 0. x x x→0 x→0 Las derivadas de las demás funciones trigonométricas se deducen con facilidad a partir de las derivadas del seno y del coseno. 6.2.7.3. Derivabilidad de las funciones hiperbólicas Las derivadas de las funciones hiperbólicas y de sus inversas se deducen con facilidad de las derivadas del logaritmo y de la exponencial. Se comprueba sin dificultad que senh ′(x) = cosh x, cosh ′(x) = senh x Las derivadas de las funciones hiperbólicas inversas son muy útiles para calcular primitivas de funciones en las que intervienen raíces cuadradas de trinomios de segundo grado. argsenh(x) = log x + x2 + 1 argsenh ′(x) = √ 1 x2 + 1 argcosh(x) = log x + x2 − 1 x > 1 argcosh ′(x) = √ 1 x2 − 1 argcosech(x) = argsenh 1 x=0 argcosech ′(x) = √−1 x |x| x2 + 1 argsech(x) = argcosh 1 0<x<1 argsech ′(x) = √−1 x x 1 − x2 Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Teoremas de Rolle y del valor medio 221 6.3. Teoremas de Rolle y del valor medio Los resultados más útiles del cálculo diferencial se refieren a funciones derivables en todos los puntos de un intervalo. El teorema del valor medio es frecuentemente atribuido a Joseph Louis Lagrange; no obstante, fue publicado por vez primera en 1806 por el físico André Marie Ampére que justificaba el resultado usando ideas de Lagrange y suponiendo que la función derivada era continua; lo cual, como se verá enseguida, es innecesario. Quince años más tarde Augustin Cauchy volvió a probar el teorema con las mismas hipótesis. El teorema del valor medio es uno de los resultados más útiles del Cálculo. Su utilidad se debe principalmente a que dicho teorema permite acotar el incremento de una función cuando se conoce una cota de su derivada. Michel Rolle (1652 - 1719) fue miembro de la Académie des Sciences y en 1691, estudian- do un método para resolver ecuaciones, estableció, sin demostrar, el teorema que ahora lleva su nombre que, como veremos, es esencialmente equivalente al teorema del valor medio. 6.13 Definición. Dada una función cualquiera f : I → R, se dice que f tiene en un punto a ∈ I un máximo relativo (resp. mínimo relativo) si hay algún número r > 0 tal que ]a − r, a + r[⊂ I y ∀x ∈]a − r, a + r[ se verifica que f (x) f (a) (resp. f (x) f (a)). La expresión extremo relativo se utiliza para referirse indistintamente a un máximo o a un mínimo relativo. (c, f (c)) La función f tiene máximos relativos en los puntos a y c y mínimos relativos en los puntos b (a, f (a)) y d. Nótese que f (d) > f (a), es decir, el valor de una función en un mínimo relativo puede ser (d, f (d)) mayor que el valor en un máximo relativo. (b, f (b)) Figura 6.5. Extremos relativos 6.14 Proposición (Condición necesaria de extremo relativo). Sea f : I → R, a ∈ I y supongamos que f tiene un extremo relativo en a y que f es derivable en a. Entonces se verifica que f ′(a) = 0. Demostración. Supongamos que a es un máximo relativo de f . Entonces hay un número r > 0 tal que ]a − r, a + r[⊂ I y ∀x ∈]a − r, a + r[ se verifica que f (x) f (a). Puesto que f es derivable en a y el punto a no es un extremo del intervalo I, se verifica que: xl´ı→ma f (x) − f (a) = f ′(a) = xl´ı→ma f (x) − f (a) x − a x − a x<a x>a Puesto que para a−r < x < a es f (x) − f (a) 0, se sigue que xl´ı→ma f (x) − f (a) 0. x − a x − a 0. x<a Puesto que para a<x<a+r es f (x) − f (a) 0, se sigue que xl´ı→ma f (x) − f (a) x − a x − a x>a Por tanto f ′(a) = 0. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Teoremas de Rolle y del valor medio 222 El resultado anterior es uno de los que peor se interpretan debido a que suelen olvidarse sus hipótesis, que son dos: • Que el punto a sea un extremo relativo de f . • Que f sea derivable en a. La expresión “como f tiene un extremo en a, su derivada debe anularse en a” no es, en general, correcta. Los siguientes ejemplos lo dejan bien claro: • La función f : R → R dada por f (x) = |x|, tiene claramente un mínimo relativo (y también absoluto) en 0, pero no es derivable en 0, por lo que no tiene ningún sentido decir que su derivada se anula en 0. • La función f : [−1, 1] → R dada por f (x) = x3, es estrictamente creciente, es deriva- ble en todo punto y su derivada solamente se anula en x = 0. Tiene un mínimo absoluto en −1 y un máximo absoluto en 1; dichos puntos no son extremos relativos de la fun- ción. Este ejemplo también muestra que la condición necesaria de extremo relativo no es suficiente. Los puntos en los que se anula la derivada de una función se llaman puntos críticos o puntos singulares de dicha función. 6.15 Teorema (Teorema de Rolle). Sea f : [a, b] → R una función continua en [a, b], deri- vable en ]a, b[ y verificando que f (a) = f (b). Entonces existe algún punto c ∈]a, b[ tal que f ′(c) = 0. Demostración. La continuidad de f en [a, b] garantiza que f alcanza en un punto u ∈ [a, b] un mínimo absoluto y en un punto v ∈ [a, b] un máximo absoluto. Si {u, v} = {a, b}, entonces será f ′(c) = 0 f (u) = f (v) y, por tanto f es constante y = f (x) en [a, b] y, en consecuencia, su derivada es nula. Si {u, v} = {a, b}, entonces alguno de los puntos u, v está en ]a, b[ y es un ex- tremo relativo de f por lo que, en virtud de la proposición anterior, concluimos que la derivada de f se anula en algún punto de ]a, b[. ac b Figura 6.6. Teorema de Rolle Observaciones. Observa que la demostración del teorema de Rolle que hemos dado, que es la usual, depende de forma esencial del teorema de Weierstrass 4.29 que garantiza la existencia de valores extremos absolutos. El enunciado anterior del teorema de Rolle es el usual; pero, en cierto sentido, es “de- masiado preciso”. Esto se debe a que las hipótesis que se consideran en el teorema son las mínimas√indispensables. Por ejemplo, si consideramos la función f : [−1, 1] → R dada por f (x) = 1 − x2, cuya gráfica es la mitad superior de la circunferencia unidad, se tiene que f es continua en [−1, 1], derivable en ] − 1, 1[ y, claro está, su derivada se anula en x = 0. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Teoremas de Rolle y del valor medio 223 Esta función no es derivable en los extremos del intervalo. Pero la situación más corriente es que la función sea derivable en todo el intervalo, incluidos sus extremos. Además, es frecuente trabajar con funciones definidas en intervalos abiertos que no tienen puntos extremos, en cuyo caso debemos elegir un intervalo apropiado para aplicar el teorema. El teorema de Rolle se usa para estudiar raíces de ecuaciones, pues permite relacionar los ceros de una función derivable con los de su derivada. Un cero de una función es, naturalmente, un punto en el que la función se anula. 6.16 Corolario. a) Entre cada dos ceros de una función derivable en un intervalo hay por lo menos un cero de su derivada. b) Entre cada dos ceros consecutivos de la derivada de una función en un intervalo, so- lamente puede haber, como mucho, un cero de la función; o puede que la función no tenga ningún cero entre los dos ceros de su derivada. Demostración. a) Sea f : I → R una función derivable en un intervalo I. Sean a, b ∈ I tales que f (a) = f (b) = 0. El teorema de Rolle nos dice que hay algún punto entre a y b en el que se anula la derivada de f . b) Supongamos que s, t son ceros consecutivos de la derivada de f , esto es, f ′(s) = f ′(t) = 0 y f ′ no se anula en ningún punto comprendido entre s y t. En tal caso puede ocurrir que f no tenga ningún cero comprendido entre s y t o que tenga solamente uno. No puede ocurrir que f tenga más de un cero entre s y t, pues en tal caso su derivada tendría que anularse en algún punto comprendido entre s y t, cosa que no sucede. El apartado b) suele expresarse diciendo que los ceros de la derivada separan los ceros de la función. Debes entender bien lo que se afirma en b). Por ejemplo, puede ocurrir que la derivada se anule en varios puntos y la función no se anule nunca: la función f (x) = 2 + sen x no se anula nunca, pero su derivada f ′(x) = cos x tiene infinitos ceros. 6.17 Teorema (Teorema del valor medio). Sea f : [a, b] → R una función continua en [a, b] y derivable en ]a, b[. Entonces existe algún punto c ∈]a, b[ tal que f ′(c) = f (b) − f (a) (6.4) b − a Demostración. Definamos una función g : [a, b] → R por g(x) = f (x) + λx donde λ lo elegiremos por la condición de que g(a) = g(b), es decir: f (a) + λa = f (b) + λb −→ λ = − f (b) − f (a) b − a Podemos aplicar ahora el teorema de Rolle en el intervalo [a, b] a la función g(x) = f (x) − f (b) − f (a) x b − a para deducir que hay un punto c ∈]a, b[ tal que g ′(c) = f ′(c) − f (b) − f (a) = 0 b − a Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Consecuencias del teorema del valor medio 224 (c, f (c)) y = f (c) + f ′(c)(x − c) α (b, f (b)) (a, f (a)) tg(α) = f (b) − f (a) = f ′(c) b−a ac b Figura 6.7. Teorema del valor medio lo que concluye la demostración. Lo que afirma el teorema del valor medio es que el incremento medio de una función en un intervalo es igual a su derivada o “incremento puntual” en algún punto del mismo. Geométri- camente: la tangente a la gráfica de f en algún punto c comprendido entre a y b es paralela a la cuerda que une los puntos (a, f (a) y (b, f (b)). Observa que el teorema del valor medio lo hemos deducido del teorema de Rolle, pero es evidente que el teorema de Rolle puede deducirse del teorema del valor medio. Son dos resultados equivalentes. En lo que sigue nos referiremos al teorema del valor medio por las siglas TVM. 6.3.1. Consecuencias del teorema del valor medio 6.18 Proposición. Sea f una función derivable en un intervalo I, y supongamos que existe M 0 tal que |f ′(x)| M para todo x ∈ I. Entonces se verifica que |f (x) − f (y)| M |x − y| para todos x, y ∈ I (6.5) En particular, si f ′(x) = 0 para todo x ∈ I entonces f es constante en I. Demostración. Dados x, y ∈ I, el TVM aplicado a la función f en el intervalo de extremos x e y nos dice que hay algún punto z en dicho intervalo tal que f (x) − f (y) = f ′(z)(x − y). Tomando valores absolutos tenemos |f (x) − f (y)| = |f ′(z)||x − y| M |x − y| Si la derivada de f es idénticamente nula en I podemos tomar M = 0 en la desigualdad (6.5) para obtener que f (x) = f (y) para todos x, y ∈ I, lo que nos dice que f es constante en I. El resultado anterior, además de su interés teórico, es muy útil para probar desigualdades. En la proposición anterior la hipótesis de que I es un intervalo es esencial. La función f :]0, 1[∪]1, 2[→ R dada por f (x) = 1 si 0 < x < 1 y f (x) = 2 si 1 < x < 2, es derivable en todo punto con derivada nula y no es constante. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Consecuencias del teorema del valor medio 225 6.19 Proposición. Sea I un intervalo, a ∈ I y f una función continua en I y derivable en I\\{a}. Si la función derivada f ′ tiene límite por la derecha (resp. por la izquierda) en a entonces f es derivable por la derecha (resp. por la izquierda) en a con derivada por la derecha (resp. por la izquierda) en a igual al valor de dicho límite. En particular, si existe l´ım f ′(x) = L entonces x→a f es derivable en a y f ′(a) = L. Demostración. Supongamos xl´ı→ma f ′(x) = L. Dado ε > 0, existe δ > 0 tal que ]a − δ, a] ⊂ I x<a y para a − δ < x < a se verifica que |f ′(x) − L| < ε. Dado x ∈]a − δ, a], podemos aplicar el teorema del valor medio a la función f en el intervalo [x, a] y deducimos que hay algún punto c ∈]x, a[⊂]a − δ, a[ tal que f (x) − f (a) = f ′(c)(x − a) y por tanto: f (x) − f (a) − L = |f ′(c) − L| < ε. x − a Lo que prueba que xl´ı→ma f (x) − f (a) = L, x − a x<a es decir, f es derivable por la izquierda en a y la derivada por la izquierda de f en a es igual a L. El resto de las afirmaciones del enunciado se deducen fácilmente de lo anterior. La proposición anterior tiene una interesante consecuencia que, entre otras cosas, nos in- forma de que no toda función puede ser la derivada de otra. 6.20 Corolario. Las funciones derivadas definidas en intervalos no tienen discontinuidades evitables ni de salto. 6.21 Proposición (Derivabilidad y monotonía). Sea f : I → R derivable en todo punto del intervalo I con la posible excepción de los puntos extremos de I. Se verifica entonces que f es creciente (resp. decreciente) en I si, y sólo si, f ′(x) 0 (resp. f ′(x) 0) para todo x ∈ I. Demostración. Supongamos que f ′(x) 0 para todo x ∈ I. Dados dos puntos u, v ∈ I con u < v, podemos aplicar el teorema del valor medio a f en el intervalo [u, v] para deducir que existe c ∈]u, v[ tal que f (v) − f (u) = f ′(c)(v − u) 0, por lo que f (u) f (v), es decir f es creciente. Recíprocamente, si f es creciente en I entonces para todos a, x ∈ I, con x = a, se tiene f (x) − f (a) 0, lo que implica que: que x − a l´ım f (x) − f (a) = f ′(a) 0. x − a x→a Este resultado es muy útil para probar desigualdades entre funciones. Muchos problemas de desigualdades responden al siguiente esquema. Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Consecuencias del teorema del valor medio 226 6.22 Estrategia. Supuesto que f y g son funciones derivables, para probar que f (x) g(x) para todo x a, se hace lo siguiente: • Se define h(x) = g(x) − f (x) y se comprueba que h(a) = 0. • Se comprueba que h′(x) 0 para todo x > a. Esta última desigualdad implica que h es creciente en [a, +∞[ y, como h(a) = 0, conclui- mos que h(x) 0, es decir, g(x) − f (x) 0, para todo x > a. Naturalmente, los detalles pueden cambiar. Puede que el punto a debas elegirlo tú. Es una estrategia que tiene éxito cuando la desigualdad h′(x) 0 es más fácil que la inicial. Puede ocurrir que esta desigualdad siga siendo complicada; entonces podemos aplicarle a ella el mismo procedimiento, comprobamos que h′(a) = 0 y que h ′′(x) 0 para todo x > a, lo que implica que h′ es creciente en [a, +∞[ y, como h′(a) = 0, concluimos que h′(x) 0 para todo x > a. De la proposición (6.21) se deduce el siguiente resultado de extremo absoluto. 6.23 Proposición (Criterio de extremo absoluto). Sea f una función continua en [a, b] y derivable en todo punto de ]a, b[ con la posible excepción de un punto c ∈]a, b[. a) Si f ′(x) 0 para todo x ∈]a, c[ y f ′(x) 0 para todo x ∈]c, b[, entonces f alcanza en c un máximo absoluto en [a, b]. 0 para todo x ∈]c, b[, entonces f alcanza en c b) Si f ′(x) 0 para todo x ∈]a, c[ y f ′(x) un mínimo absoluto en [a, b]. Demostración. a) Las hipótesis hechas implican, en virtud de la proposición (6.21), que f es creciente en [a, c] y decreciente en [c, b]. Por tanto, se verifica que f (x) f (c) para todo x ∈ [a, b]. La demostración del apartado b) se hace de la misma forma. El anterior criterio de extremo absoluto suele aplicarse en puntos donde la derivada se anula. Aunque el resultado anterior está enunciado en términos de extremos absolutos, está claro que si se aplica a un pequeño intervalo contenido en un intervalo más grande, donde la función está definida, dicho resultado proporciona en tal caso un criterio de extremo relativo. 6.24 Teorema. Sea f : I → R derivable en el intervalo I con f ′(x) = 0 para todo x ∈ I. Se verifica entonces una de las dos afirmaciones siguientes: f es estrictamente creciente y f ′(x) > 0 para todo x ∈ I. f es estrictamente decreciente y f ′(x) < 0 para todo x ∈ I. Demostración. Dados dos puntos u, v ∈ I con u = v, podemos razonar como antes para obtener que existe c ∈]u, v[ tal que f (v) − f (u) = f ′(c)(v − u) = 0. Hemos probado así que f es inyectiva en el intervalo I. Como, además f es continua en I (por ser derivable), podemos usar el resultado 4.26 del capítulo 4, para deducir que f es estrictamente monótona en I. Es Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral

Consecuencias del teorema del valor medio 227 suficiente tener en cuenta ahora la proposición anterior para concluir la demostración. Es importante advertir que el resultado anterior nos dice que si una función f es derivable en un intervalo y la derivada f ′ toma valores positivos y negativos, entonces f ′ se anula en algún punto. Este resultado recuerda mucho al teorema de los ceros de Bolzano para funciones continuas en un intervalo, con una notable diferencia: aquí no exigimos que la función deri- vada f ′ sea continua. De hecho, se verifica el siguiente resultado que es un teorema del valor intermedio para funciones derivadas, en el que no se supone que la derivada sea continua. 6.25 Teorema (Propiedad del valor intermedio para derivadas). Sea ϕ una función definida en un intervalo I que es la derivada de alguna función en dicho intervalo. Entonces se verifica que la imagen por ϕ de I, ϕ(I), es un intervalo. Demostración. Por hipótesis hay una función derivable f : I → R tal que ϕ(x) = f ′(x) para todo x ∈ I. Sean u = ϕ(a), v = ϕ(b) dos valores que toma la función ϕ, y supon- gamos u < v. Dado λ ∈]u, v[, definimos la función g(x) = f (x) − λx. Tenemos entonces g ′(a) = ϕ(a) − λ = u − λ < 0 y g ′(b) = ϕ(b) − λ = v − λ > 0. Por tanto, la derivada de g toma valores positivos y negativos en el intervalo I y, por el teorema 6.24, tiene que anularse, es decir, existe algún punto c ∈ I tal que g ′(c) = ϕ(c) − λ = 0, esto es, ϕ(c) = λ. Hemos probado así que si ϕ toma dos valores también toma todos los comprendidos entre ellos dos, es decir, que ϕ(I) es un intervalo. 6.26 Proposición (Derivación de la función inversa). Sea f : I → R derivable en el intervalo I con derivada f ′(x) = 0 para todo x ∈ I. Entonces f es una biyección de I sobre el intervalo J = f (I), y la función inversa f −1 : J → R es derivable en J siendo (f −1)′(y) = f 1 (y ∈ J). (6.6) ′(f −1(y)) Demostración. Las hipótesis hechas implican que f es estrictamente monótona y continua; por tanto es una biyección de I sobre J = f (I), y la función inversa f −1 : J → R es continua en J (4.25). Sea b = f (a) ∈ J. Puesto que l´ım x − a = f 1 , f (x) − f (a) ′(a) x→a la función h : I → R dada por: h(x) = x − a para x = a, h(a) = f 1 f (x) − f (a) ′(a) es continua en I. Como f −1 es continua en J, deducimos que h ◦ f −1 es continua en J, por lo que, en particular, l´ım h(f −1(y)) = h(f −1(b)) = h(a). Pero, para todo y ∈ J, con y = b es y→b h(f −1(y)) = f −1(y) − f −1(b) . y − b Concluimos así que l´ım f −1(y) − f −1(b) = 1 y − b f ′(a) y→b Universidad de Granada Prof. Javier Pérez Dpto. de Análisis Matemático Cálculo diferencial e integral


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook