MA–1003: Apuntes de Cálculo III Joseph C. Várilly Escuela de Matemática, Universidad de Costa Rica II Ciclo Lectivo del 2022 Introducción Este es un curso de cálculo en varias variables. Como es tradicional la palabra “cálculo” aquí se refiere a aquellos cómputos que involucran derivadas o integrales de funciones.1 En los cursos anteriores esas operaciones se aplicaban a funciones de una sola variable real. Ahora se va a abarcar funciones de más variables – generalmente dos o tres variables en la gran mayoría de los ejemplos. Esto requiere cierta familiaridad con la estructura del plano real ℝ2 y del espacio real tridimensional ℝ3. Es importante poder visualizar las superficies y los sólidos que servirán como regiones de integración; este curso tiene un contenido visual más alto que los cursos anteriores, pero siempre al servicio de obtener las expresiones algebraicas o las cantidades numéricas buscadas. Programa de materias 1 Superficies y curvas Rectas y planos en dos o tres dimensiones. Elementos de dibujo en el espacio tridi- mensionalℝ3. Superficies cuadráticas enℝ3: elipsoides, hipérboloides y paraboloides. Curvas en el espacio ℝ3, longitud de arco. Velocidad y aceleración a lo largo de una curva. La curvatura y la torsión de una curva, el uso del triedro móvil para calcularlas. 2 Derivadas parciales Funciones de dos o tres variables reales. Derivadas parciales de primer y segundo orden, vectores gradientes y derivadas direccionales. Planos tangentes y rectas nor- males. La regla de la cadena en varias variables. Derivación implícita. La fórmula de Taylor en varias variables. Puntos críticos y su clasificación. Extremos absolutos en regiones con borde. Extremos ligados, multiplicadores de Lagrange. 1La palabra latina calculus, el diminutivo de calx (piedra caliza) originalmente denotaba una pequeña piedra usado para contar o ayudar cómputos aritméticos. MA–1003: Cálculo III 3 Integrales múltiples Integrales dobles de regiones planas. Regiones planas no rectangulares, cambio del orden de integración. Cambio de variables en integrales dobles. Integrales triples: parametrización y graficación de regiones sólidas enℝ3. Cálculo de áreas y volúmenes por integrales dobles y triples. Uso de coordenadas cilíndricas y esféricas en ℝ3. 4 Análisis vectorial Integrales de línea. Parametrización de curvas en ℝ2 y ℝ3. Campos vectoriales con- servativos y sus funciones potenciales. El teorema de Green en el planoℝ2. Integrales de superficie. Parametrización de superficies en ℝ3. Cálculo de flujos de un campo vectorial. El teorema de Gauss para superficies cerradas. Orientación de superficies con borde. El teorema de Stokes. Bibliografía En la página web del curso, se colocará semanalmente unos apuntes detallados. Abun- dan los libros sobre cálculo en varias variables; a continuación se ofrece una selección de libros recomendables. 1 Tom M. Apostol, Calculus 2, 2a edición, Reverté, Barcelona, 1985. 2 Juan Félix Ávila Herrera, Cálculo en varias variables. Editorial UCR, San José, 2017. 3 Boris P. Demidovich, Problemas y ejercicios de análisis matemático, Mir, Moscú, 1977. 4 C. Henry Edwards y David E. Penney, Cálculo con trascendentes tempranas, 7a edición, Pearson Educación, México, DF, 2008. 5 Stanley I. Grossman, Calculus, Academic Press, New York, 1981. 6 Jerrold E. Marsden y Anthony J. Tromba, Cálculo vectorial, Addison-Wesley Latino- americana, Wilmington, DE, 1991. 7 James Stewart, Cálculo en varias variables, 8a edición, Cengage, México, DF, 2018. (Disponible para lectura en línea en ⟨http://sibdi.ucr.ac.cr/buscardbb.php⟩) 2 Índice general 1 Superficies y curvas 1-1 1.1. Geometría analítica plana 1-1 1.2. Planos y rectas en ℝ3 1-4 1.3. Superficies especiales en ℝ3 1-10 1.4. Curvas en el espacio ℝ3 1-13 2 Derivadas parciales 2-1 2.1. Funciones de varias variables reales 2-1 2.2. Planos tangentes y rectas normales 2-7 2.3. La regla de la cadena 2-10 2.4. Derivación implícita 2-17 2.5. La fórmula de Taylor en varias variables 2-23 2.6. Máximos y mínimos 2-30 3 Integrales múltiples 3-1 3.1. Integrales dobles en regiones planas 3-3 3.2. Cambio de variables en integrales dobles 3-14 3.3. Integrales triples 3-27 3.4. Coordenadas cilíndricas y esféricas 3-36 4 Análisis vectorial 4-1 4.1. Integrales de línea 4-1 4.2. Integrales de superficie 4-20 4.3. El teorema de Stokes 4-32 3 MA–1003: Cálculo III 1 Superficies y curvas At any given Point of a given Curve, to find the Quantity of Curvature. There are few Problems concerning Curves more elegant than this, or that give a greater Insight into their nature. — Isaac Newton1 1.1. Geometría analítica plana Antes de abordar superficies y curvas en el espacio tridimensional, conviene hacer un breve repaso de las rectas y algunas curvas en el plano. Los puntos del plano real ℝ2 se denotan por sus coordenadas cartesianas (𝑥,𝑦). El espacio real tridimensional se denota por ℝ3 y sus puntos tiene tres coordenadas cartesianas: el punto general es (𝑥,𝑦, 𝑧). Las coordenadas de puntos serán reales (no complejas) a lo largo de este curso. En ℝ3, conviene usar una notación vectorial: se escribe ®𝒓 = (𝑥,𝑦, 𝑧) para denotar la posición de un punto del espacio. Esta cantidad ®𝒓 se llama un vector. Los vectores se pueden sumar y es posible multiplicar un vector por un número real (un escalar): ®𝒓 1 + ®𝒓 2 = (𝑥1 + 𝑥2, 𝑦1 + 𝑦2, 𝑧1 + 𝑧2), 𝑐 ®𝒓 = (𝑐𝑥, 𝑐𝑦, 𝑐𝑧). Rectas en el plano ℝ2 Una recta en ℝ2 tiene una ecuación de primer grado: 𝐴𝑥 + 𝐵𝑦 +𝐶 = 0, con 𝐴2 + 𝐵2 > 0 (es decir, se prohíbe el caso 𝐴 = 𝐵 = 0, por razones obvias). La recta que pasa por el punto (𝑥0, 𝑦0) con pendiente𝑚 tiene la ecuación: 𝑦 − 𝑦0 =𝑚(𝑥 − 𝑥0). La recta que pasa por dos puntos distintos (𝑥1, 𝑦1) y (𝑥2, 𝑦2) tiene la ecuación: (𝑦2 − 𝑦1) (𝑥 − 𝑥1) − (𝑥2 − 𝑥1) (𝑦 − 𝑦1) = 0. (1.1) Esta ecuación (a) es de primer grado; y (b) pasa por los dos puntos indicados. 1En el libro The Method of Fluxions and Infinite Series, publicado póstumamente en Londres, 1736. 1-1 MA–1003: Cálculo III 1.1. Geometría analítica plana La ecuación anterior se puede reorganizar en la forma:2 𝑦 − 𝑦1 𝑦2 − 𝑦1 = 𝑥 − 𝑥1 𝑥2 − 𝑥1 y estas fracciones determinan una nueva variable auxiliar o parámetro 𝑡 , al poner 𝑡 := 𝑦 − 𝑦1 𝑦2 − 𝑦1 = 𝑥 − 𝑥1 𝑥2 − 𝑥1 . Nótese que los denominadores son constantes; al escribir 𝑎 = 𝑥2 − 𝑥1 y 𝑏 = 𝑦2 − 𝑦1, el sistema 𝑦 − 𝑦1 𝑏 = 𝑥 − 𝑥1 𝑎 = 𝑡 se convierte en un par de ecuaciones: { 𝑥 = 𝑥1 + 𝑎𝑡 𝑦 = 𝑦1 + 𝑏𝑡 } (1.2) que representa la misma recta en forma paramétrica. Se ha reemplazado la sola ecuación (1.1) por dos ecuaciones, que involucran una variable extra 𝑡 (el parámetro). Ahora bien, si se elimina la 𝑡 de entre estos dos ecuaciones, se regresa a la sola ecuación (1.1) en las variables originales 𝑥,𝑦. (0, 0) 𝑥 𝑦 (𝑥1, 𝑦1) 0 (𝑥,𝑦) 𝑡 (𝑥2, 𝑦2) 1 • • • Figura 1.1: Una recta que pasa por dos puntos del plano ℝ2 El parámetro 𝑡 sirve para identificar los puntos individuales de la recta. Al restaurar 𝑎 = 𝑥2 − 𝑥1 y 𝑏 = 𝑦2 − 𝑦1 en la fórmula (1.2), se obtiene 𝑥 = 𝑥1 + 𝑡 (𝑥2 − 𝑥1), 𝑦 = 𝑦1 + 𝑡 (𝑦2 − 𝑦1), 2Esta igualdad de fracciones es equivalente a la ecuación (1.1), excepto si 𝑥2 = 𝑥1 o bien 𝑦2 = 𝑦1, porque en tales casos uno de los denominadores es cero. Para tomar esos casos en cuenta, se decreta que si el denominador vale 0 entonces el numerador es también 0. Así pues, si 𝑥2 = 𝑥1, se deduce que 𝑥 = 𝑥1 (una recta vertical); y si 𝑦2 = 𝑦1, se concluye que 𝑦 = 𝑦1 (una recta horizontal). 1-2 MA–1003: Cálculo III 1.1. Geometría analítica plana o bien: 𝑥 = (1 − 𝑡)𝑥1 + 𝑡𝑥2 𝑦 = (1 − 𝑡)𝑦1 + 𝑡𝑦2 (1.3) Esta fórmula representa la recta que pasa por dos puntos distintos (𝑥1, 𝑦1) y (𝑥2, 𝑦2), ahora en forma paramétrica. Cuando 𝑡 = 0 se ve que (𝑥,𝑦) = (𝑥1, 𝑦1); cuando 𝑡 = 1 se ve que (𝑥,𝑦) = (𝑥2, 𝑦2). Los valores 0 ⩽ 𝑡 ⩽ 1 corresponden a los puntos del segmento de recta con extremos (𝑥1, 𝑦1) y (𝑥2, 𝑦2); véase la Figura 1.1. Los otros valores de 𝑡 , es decir, los casos 𝑡 < 0 y 𝑡 > 1 respectivamente, corresponden a las dos semirrectas complementarias a ese segmento. Curvas cuadráticas en ℝ2 Una ecuación de segundo grado en el plano es de la forma 𝐴𝑥2 + 2𝐻𝑥𝑦 + 𝐵𝑦2 + 2𝐺𝑥 + 2𝐹𝑦 +𝐶 = 0. (1.4) Dependiendo de las coeficientes𝐴, 𝐵,𝐶, 𝐹,𝐺, 𝐻 en esta fórmula, esta ecuación representa curvas de diversa naturaleza. Por ejemplo, 𝑥2 + 𝑦2 = 0 es un solo punto (𝑥,𝑦) = (0, 0). Peor todavía, la ecuación 𝑥2 + 𝑦2 + 1 = 0 es una curva vacía, que no tiene punto alguno porque la ecuación no tiene solución para 𝑥,𝑦 números reales. (En este curso, no interesan las soluciones complejas.) ▶ Al excluir tales “casos degenerados”, queda el caso reducible en donde el lado izquierdo se factoriza en el producto de dos expresiones de primer grado: (𝐴1𝑥 + 𝐵1𝑦 +𝐶1) (𝐴2𝑥 + 𝐵2𝑦 +𝐶2) = 0. Esta ecuación representa el par de rectas 𝐴1𝑥 + 𝐵1𝑦 +𝐶1 = 0 y 𝐴2𝑥 + 𝐵2𝑦 +𝐶2 = 0. Un punto (𝑥,𝑦) sobre cualquiera de estas dos rectas cumple la ecuación compuesta. ▶ La mayoría de las ecuaciones cuadráticas no son degenerados ni reducibles. Se desta- can tres casos importantes (Figura 1.2): (a) La ecuación 𝑥2 𝑎2 + 𝑦 2 𝑏2 = 1 es una elipse con semiejes 𝑎 > 0 y 𝑏 > 0. Cuando 𝑎 = 𝑏, este es 𝑥2 + 𝑦2 = 𝑎2, el círculo de radio 𝑎 centrado en (0, 0). 1-3 MA–1003: Cálculo III 1.2. Planos y rectas en ℝ3 𝑎 𝑥 𝑏 𝑦 (a) elipse 𝑎 𝑥 𝑦 (b) hipérbola 𝑥 𝑦 (c) parábola Figura 1.2: Curvas cuadráticas irreducibles (b) La ecuación 𝑥2 𝑎2 − 𝑦 2 𝑏2 = 1 es una hipérbola con asíntotas: 𝑥 𝑎 ± 𝑦 𝑏 = 0 . Las asíntotas de la hipérbola son dos rectas, que no tienen puntos en común con la hipérbola porque vienen de la ecuación cuadrática: reducible 𝑥2 𝑎2 − 𝑦 2 𝑏2 = 0. (c) La ecuación 𝑦2 = 4𝑐𝑥 es una parábola. La recta 𝑦 = 0 (que es el eje 𝑥) es un eje de simetría de esta parábola: la reflexión 𝑥′ = 𝑥 , 𝑦′ = −𝑦 deja la parábola invariante. Ahora bien: cualquier transformación (𝑥,𝑦) ↦→ (𝑥′, 𝑦′) del plano que lleva rectas en rectas tiene la forma general: 𝑥 = 𝑙 𝑥′ +𝑚𝑦′ + 𝑛, 𝑦 = 𝑝 𝑥′ + 𝑞𝑦′ + 𝑟, con 𝑙𝑞 −𝑚𝑝 ≠ 0. Tales cambios de coordenadas no cambian el aspecto general de una curva cuadrática. Resulta que cualquier curva no degenerada con ecuación cuadrática irreducible puede cambiarse, de este modo, en una de las tres formas mencionadas: es una elipse, una hipérbola o una parábola. 1.2. Planos y rectas en ℝ3 Planos en el espacio ℝ3 En el espacio tridimensional, una ecuación de primer grado representa un plano: 𝐴𝑥 + 𝐵𝑦 +𝐶𝑧 + 𝐷 = 0, con 𝐴2 + 𝐵2 + 𝐶2 ≠ 0. ⟦Se prohíbe el caso 𝐴 = 𝐵 = 𝐶 = 0, porque no da información sobre la ubicación de los puntos (𝑥,𝑦, 𝑧).⟧ 1-4 MA–1003: Cálculo III 1.2. Planos y rectas en ℝ3 0 𝑥 𝑦 𝑧 ®𝒓 0 ®𝒓• ®𝒏 ®𝒓 − ®𝒓 0 Figura 1.3: El plano que pasa por el punto ®𝒓 0 con vector normal ®𝒏 Un plano que pasa por el punto (𝑥0, 𝑦0, 𝑧0) tiene una ecuación de la forma 𝐴(𝑥 − 𝑥0) + 𝐵(𝑦 − 𝑦0) +𝐶 (𝑧 − 𝑧0) = 0. (1.5a) El lado izquierdo de esta ecuación es un producto escalar (producto punto) de vectores: ®𝒏 · (®𝒓 − ®𝒓 0) = 0, (1.5b) donde ®𝒏 = (𝐴, 𝐵,𝐶), ®𝒓 = (𝑥,𝑦, 𝑧), ®𝒓 0 = (𝑥0, 𝑦0, 𝑧0); y ®𝒓 − ®𝒓 0 = (𝑥 − 𝑥0, 𝑦 − 𝑦0, 𝑧 − 𝑧0). (El producto punto de dos vectores ®𝒖 = (𝑎, 𝑏, 𝑐) y ®𝒗 = (𝑙,𝑚, 𝑛) es el número real ®𝒖 · ®𝒗 := 𝑎𝑙 + 𝑏𝑚 + 𝑐𝑛.) Dos vectores en ℝ3 son ortogonales (o perpendiculares) si y solo si su producto punto es igual a 0. La ecuación (1.5b) dice que el vector fijo ®𝒏 es ortogonal al vector variable ®𝒓 − ®𝒓 0 que se representa por una flecha desde el punto ®𝒓 0 al punto ®𝒓 . Entonces el plano comprende el punto particular ®𝒓 0 y todos los otros puntos ®𝒓 que cumplen esta condición. (Véase la Figura 1.3.) Este ®𝒏 es un vector normal al plano. La dirección del vector ®𝒏 determina la inclinación del plano; el punto ®𝒓 0 ubica este plano entre la familia de planos paralelos con esa misma inclinación. ▶ Tres puntos (no colineales) determinan un plano. Para obtener el plano que pasa por tres puntos ®𝒓 0, ®𝒓 1, ®𝒓 2, se puede aceptar el primer punto ®𝒓 0 y usar la fórmula (1.5b) para escribir la ecuación del plano; sólo falta averiguar el vector normal ®𝒏. Ahora las flechas ®𝒓 1 − ®𝒓 0 y ®𝒓 2 − ®𝒓 0 representan direcciones en el plano y ®𝒏 debe ser ortogonal a ambas flechas. Por eso, se toma: ®𝒏 = (®𝒓 1 − ®𝒓 0) × (®𝒓 2 − ®𝒓 0). Se debe recordar que el producto cruz ®𝒖 × ®𝒗 es un vector en ℝ3 que es ortogonal a ®𝒖 y también a ®𝒗 ; y que ®𝒖 × ®𝒗 = ®0 si y solo si ®𝒖 , ®𝒗 son paralelos (es decir, proporcionales). La fórmula anterior da ®𝒏 = ®0 si y solo si ®𝒓 1 − ®𝒓 0 y ®𝒓 2 − ®𝒓 0 son proporcionales, si y solo si ®𝒓 0, ®𝒓 1, ®𝒓 2 son colineales – en cuyo caso determinan una recta y no un plano. 1-5 MA–1003: Cálculo III 1.2. Planos y rectas en ℝ3 Rectas en el espacio ℝ3 Una recta en el espacio tridimensional es simplemente la intersección de dos planos: 𝐴1𝑥 + 𝐵1𝑦 +𝐶1𝑧 + 𝐷1 = 0, 𝐴2𝑥 + 𝐵2𝑦 +𝐶2𝑧 + 𝐷2 = 0. Luego, se requiere dos ecuaciones de primer grado para caracterizar una recta en ℝ3. ▶ Tal como se hizo en ℝ2, es posible introducir un parámetro 𝑡 que marca los diversos puntos de la recta. La forma paramétrica de las ecuaciones de una recta entonces requiere tres ecuaciones (siempre de primer grado) en las cuatro variables 𝑥,𝑦, 𝑧, 𝑡 . Por ejemplo, la recta que pasa por un punto ®𝒓 0 = (𝑥0, 𝑦0, 𝑧0) en la dirección ®𝒗 = (𝑙,𝑚, 𝑛) –un vector constante, no nulo – obedece ®𝒓 = ®𝒓 0 + 𝑡 ®𝒗 , 𝑡 ∈ ℝ. (1.6a) Esta ecuación vectorial es equivalente a tres ecuaciones escalares: 𝑥 = 𝑥0 + 𝑙𝑡, 𝑦 = 𝑦0 +𝑚𝑡, 𝑧 = 𝑧0 + 𝑛𝑡, 𝑡 ∈ ℝ. Al despejar la variable 𝑡 de cada una de ecuaciones, se obtiene 𝑥 − 𝑥0 𝑙 = 𝑦 − 𝑦0 𝑚 = 𝑧 − 𝑧0 𝑛 = 𝑡 . Ahora se puede suprimir la última ecuación, eliminando la variable extra 𝑡 . El resultado es la llamada forma simétrica de las ecuaciones de la recta: 𝑥 − 𝑥0 𝑙 = 𝑦 − 𝑦0 𝑚 = 𝑧 − 𝑧0 𝑛 . (1.6b) Fíjese bien: al haber eliminado el parámetro 𝑡 , quedan dos ecuaciones (hay dos signos de igualdad visibles) para las variables cartesianas 𝑥,𝑦, 𝑧. ▶ La recta que pasa por dos puntos, ®𝒓 1 = (𝑥1, 𝑦1, 𝑧1) y ®𝒓 2 = (𝑥2, 𝑦2, 𝑧2), puede anali- zarse de modo similar. Sus ecuaciones vienen de la fórmula (1.6a) al cambiar ®𝒓 0 en ®𝒓 1 y al tomar ®𝒗 = ®𝒓 2 − ®𝒓 1. Su forma paramétrica es entonces: ®𝒓 = (1 − 𝑡) ®𝒓 1 + 𝑡 ®𝒓 2 con 𝑡 ∈ ℝ. (1.7a) De nuevo, el valor 𝑡 = 0 corresponde al punto ®𝒓 = ®𝒓 1, el valor 𝑡 = 1 corresponde al punto ®𝒓 = ®𝒓 2; y el rango de valores 0 ⩽ 𝑡 ⩽ 1 corresponde al segmento de recta con los extremos ®𝒓 1 y ®𝒓 2. 1-6 MA–1003: Cálculo III 1.2. Planos y rectas en ℝ3 La forma simétrica correspondiente (después de eliminar 𝑡) es: 𝑥 − 𝑥1 𝑥2 − 𝑥1 = 𝑦 − 𝑦1 𝑦2 − 𝑦1 = 𝑧 − 𝑧1 𝑧2 − 𝑧1 . (1.7b) Si algún denominador es 0, el numerador debe ser 0 también. Por ejemplo, si 𝑦1 = 𝑦2 pero 𝑥1 ≠ 𝑥2 y 𝑧1 ≠ 𝑧2, este último par de ecuaciones es lo mismo que 𝑥 − 𝑥1 𝑥2 − 𝑥1 = 𝑧 − 𝑧1 𝑧2 − 𝑧1 , 𝑦 = 𝑦1 . Elementos de dibujo en ℝ3 En el espacio tridimensional real, denotado por ℝ3, se denota el origen por 0; los tres ejes coordenados −→ 0𝑥 , −→ 0𝑦, −→ 0𝑧 forman un triedro que se representan en un plano (una hoja de papel o una pantalla) como sigue. El eje 𝑦 positivo (esto es, la semirrecta −→ 0𝑦) apunta hacia la derecha; el eje 𝑧 positivo apunta hacia arriba; y el eje 𝑥 positivo apunta “hacia adelante”. Se traza el eje 𝑥 en una dirección aproximadamente sur-oeste, para crear la ilusión óptica de una flecha que sale del plano 𝑦𝑧 de modo perpendicular: véase la Figura 1.4. 0 𝑥 𝑦 𝑧 Figura 1.4: El triedro de los ejes cartesianos Un plano se representa por un paralelogramo, que indica su posición e inclinación de modo esquemático. (Se quiere indicar una lámina de acrílico transparente que ocupa la posición del plano en el espacio. Véase la Figura 1.3.) Si se conoce los tres puntos en donde el plano corta los ejes, el triángulo formados por estos tres vértices también sirve para representar el plano. A veces conviene extender los lados del triángulo un poco, para indicar que el plano se extiende en el espacio pero in- cluye el triángulo con los vértices dados. Los planos coordenados (el plano 𝑥𝑦, horizontal; el plano 𝑥𝑧 y el plano 𝑦𝑧, verticales) quedan delineados por los ejes cartesianos. 1-7 MA–1003: Cálculo III 1.2. Planos y rectas en ℝ3 Una superficie que no sea un plano puede representarse por un sistema de cortes verticales y horizontales, como sigue. ⋄ Al poner 𝑥 = 0, se obtiene la intersección de la superficie con el plano 𝑦𝑧 (vertical, de la hoja o pantalla), que en muchos casos – aunque no siempre – es la silueta de la superficie. ⋄ Al poner 𝑦 = 0, se obtiene la intersección de la superficie con el plano 𝑥𝑧 (vertical pero lateral). ⋄ Al poner 𝑧 = 𝑘 para varios valores constantes de 𝑘, se obtiene las cortes horizontales de la superficie a las alturas 𝑘. Todas estas curvas sirven para montar una representación visual de la superficie. 𝑥 𝑦 𝑧 Figura 1.5: El paraboloide elíptico 𝑥2 + 𝑦2 = 4𝑧 Ejemplo 1.1. Para dibujar la superficie 𝑥2 + 𝑦2 = 4𝑧 se trazan las siguientes curvas: ⋄ Corte 𝑥 = 0: se obtiene la curva 𝑦2 = 4𝑧 en el plano 𝑦𝑧, la cual es una parábola. ⋄ Corte 𝑦 = 0: se obtiene la curva 𝑥2 = 4𝑧 en el plano 𝑥𝑧, la cual es otra parábola. ⋄ Cortes 𝑧 = 𝑘: se obtiene la familia de curvas horizontales 𝑥2 + 𝑦2 = 4𝑘 en los planos respectivos 𝑧 = 𝑘. Si 𝑘 > 0, estos son círculos de radios 2 √ 𝑘. Si 𝑘 = 0, la “curva” se reduce a un punto, el origen. Si 𝑘 < 0, la ecuación 𝑥2 +𝑦2 = 4𝑘 no tiene soluciones reales; por eso, no hay puntos de la superficie debajo del plano 𝑧 = 0. Al trazar las dos parábolas y dos o tres de los círculos, se obtiene la forma de una canasta redonda: Figura 1.5. Esta superficie es un paraboloide elíptico. ♢ Ciertas líneas de este dibujo quedarían ocultas detrás de la superficie si la parte anterior se vuelve opaco. Es costumbre trazar líneas quebradas para indicar las curvas que estarían escondidas en tales condiciones. 1-8 MA–1003: Cálculo III 1.2. Planos y rectas en ℝ3 𝑥 𝑦 𝑧 Figura 1.6: El cono recto circular 𝑥2 + 𝑦2 = 𝑧2 Ejemplo 1.2. Para dibujar la superficie 𝑥2 + 𝑦2 = 𝑧2 se trazan las siguientes curvas: ⋄ Corte 𝑥 = 0: se obtiene 𝑦2 = 𝑧2 en el plano 𝑦𝑧; este es una par de rectas 𝑦 = ± 𝑧. ⋄ Corte 𝑦 = 0: se obtiene 𝑥2 = 𝑧2 en el plano 𝑥𝑧; este es otro par de rectas 𝑥 = ± 𝑧. ⋄ Cortes 𝑧 = 𝑘: se obtiene la familia de curvas horizontales 𝑥2 + 𝑦2 = 𝑘2 en los planos respectivos 𝑧 = 𝑘. Si 𝑘 ≠ 0, estos son círculos de radios √ 𝑘2 = |𝑘 |. (En este caso, 𝑘 puede ser negativo.) Si 𝑘 = 0, la “curva” se reduce a un punto, el origen. Al trazar las cuatro rectas y algunos de los círculos, se obtiene la forma de un cono (de dos embudos), con un “vértice” en el origen: véase la Figura 1.6. Esta superficie es un cono recto circular. ♢ Ejemplo 1.3. Para dibujar la superficie 4𝑥2 + 𝑦2 = 4 se trazan las siguientes curvas: ⋄ Corte 𝑥 = 0: se obtiene 𝑦2 = 4 en el plano 𝑦𝑧; este es una par de rectas 𝑦 = ± 2. Estas rectas son verticales, porque sus ecuaciones no dependen de la altura 𝑧. ⋄ Corte 𝑦 = 0: se obtiene 𝑥2 = 1 en el plano 𝑥𝑧; este es otro par de rectas 𝑥 = ± 1, que son también verticales. ⋄ Cortes 𝑧 = 𝑘: se obtiene la familia de curvas horizontales 4𝑥2 + 𝑦2 = 4 en los planos respectivos 𝑧 = 𝑘. Todas ellas son elipses de semiejes 1 y 2, colocadas a varias alturas. Al trazar las cuatro rectas y algunos de los círculos, se obtiene la forma de un cilindro recto elíptico: Figura 1.7. ♢ 1-9 MA–1003: Cálculo III 1.3. Superficies especiales en ℝ3 𝑥 𝑦 𝑧 Figura 1.7: El cilindro recto elíptico 4𝑥2 + 𝑦2 = 4 Ejemplo 1.4. Algunas otras superficies que se pueden trazar, mediante la técnica de los cortes verticales y horizontales, son las siguientes: (a) El elipsoide 𝑥2 + 4𝑦2 + 9𝑧2 = 36. (b) El hiperboloide de un manto 𝑥2 + 𝑦2 − 𝑧2 = 4. (c) El cilindro parabólico 𝑦 = 𝑥2. ♢ 1.3. Superficies especiales en ℝ3 La clasificación de superficies cuadráticas en el espacio ℝ3 es más compleja que la clasificación de las curvas cuadráticas en ℝ2. En este curso no se abordará este problema en su totalidad, sino que se considerará ejemplos típicos de tales superficies. Esferas Una esfera posee un centro (𝑥0, 𝑦0, 𝑧0) y un radio 𝑅; es la totalidad de puntos (𝑥,𝑦, 𝑧) cuya distancia del centro es igual a 𝑅. La fórmula de Pitágoras para el cuadrado de esta distancia produce la ecuación de la esfera: (𝑥 − 𝑥0)2 + (𝑦 − 𝑦0)2 + (𝑧 − 𝑧0)2 = 𝑅2. (1.8) Al expandir las paréntesis, este es lo mismo que 𝑥2 + 𝑦2 + 𝑧2 − 2𝑥0𝑥 − 2𝑦0𝑦 − 2𝑧0𝑧 + 𝑥20 + 𝑦20 + 𝑧20 − 𝑅2 = 0. Entonces se ve que una ecuación cuadrática representa una esfera si y solo si su parte cuadrática es (un múltiplo constante de) 𝑥2 + 𝑦2 + 𝑧2. De hecho, la ecuación cuadrática 𝑥2 + 𝑦2 + 𝑧2 + 2𝐺𝑥 + 2𝐹𝑦 + 2𝐸𝑧 +𝐶 = 0 representa una esfera, con centro (−𝐺,−𝐹,−𝐸) y radio 𝑅 = √ 𝐺2 + 𝐹 2 + 𝐸2 −𝐶. 1-10 MA–1003: Cálculo III 1.3. Superficies especiales en ℝ3 Cilindros Un cilindro es una superficie formada por una familia de rectas paralelas, llamadas generatrices, que pasan por los puntos respectivos de una cierta curva directriz. Un caso conocido es el cilindro recto circular 𝑥2 + 𝑦2 = 𝑎2, formado por una familia de rectas verticales (todas ellas paralelas al eje 𝑧). Cada una de estas rectas pasa por un punto del círculo horizontal de centro (0, 0, 0) y de radio 𝑎. Dicho círculo es la curva directriz. La recta vertical 𝑥 = 𝑎 cos\ , 𝑦 = 𝑎 sen\ pasa por el punto (𝑎 cos\, 𝑎 sen\, 0) del círculo. La unión de todas estas rectas generatrices es el cilindro. El cilindro recto elíptico de la Figura 1.7 es algo parecido: las generatrices son las rectas verticales que lo conforman; la elipse 4𝑥2 + 𝑦2 = 4 en el plano 𝑧 = 0 es una curva directriz. Conos Un cono es una superficie formada por una familia de rectas, sus generatrices, que pasan por un punto fijo, el vértice del cono, y también por los puntos respectivos de una cierta curva directriz. Un caso conocido es el cono recto circular 𝑥2 + 𝑦2 = 𝑧2, formado por una familia de rectas que pasan por el origen (0, 0, 0). Cada una de estas rectas pasa también por un punto del círculo horizontal de centro (0, 0, 1) y de radio 1, el cual es una curva directriz. La recta oblicua: 𝑥 = 𝑡 cos\ , 𝑦 = 𝑡 sen\ , 𝑧 = 𝑡 pasa por el origen (cuando 𝑡 = 0) y por el punto (cos\, sen\, 1) de ese círculo; la unión de todas las rectas generatrices es el cono. Superficies de revolución Una superficie de revolución se forma por una familia de círculos generatrices en planos paralelos, cuyos centros son los puntos de una recta fija, el eje de la superficie de revolución, perpendicular a esos planos; además, los círculos generatrices deben pasar por los puntos respectivos de una cierta curva directriz. Cuando el eje es uno de los ejes coordenados, esta descripción se puede simplificar. Por ejemplo, si el eje de una superficie de revolución coincide con el eje 𝑧 cartesiano, entonces cada círculo generatriz queda en un plano horizontal 𝑧 = 𝑡 (perpendicular al eje, que es vertical) con centro en el punto (0, 0, 𝑡) de ese plano: 𝑥2 + 𝑦2 = 𝑟2, 𝑧 = 𝑡 . El radio 𝑟 del círculo depende de 𝑡 : la dependencia viene de una relación 𝑓 (𝑟2, 𝑡) = 0 que define la silueta (la cual es la curva directriz). 1-11 MA–1003: Cálculo III 1.3. Superficies especiales en ℝ3 En breve, al reunir todos los requisitos se llega a una fórmula: 𝑓 (𝑥2 + 𝑦2, 𝑧) = 0, (1.9) la cual es la ecuación de la superficie de revolución alrededor del eje 𝑧. Dicho de otra manera: si una superficie tiene una ecuación de la forma (1.9), en donde las variables 𝑥,𝑦 aparecen únicamente en la combinación (𝑥2 + 𝑦2), entonces se trata de una superficie de revolución cuya eje es el eje 𝑧. Unos ejemplos son los cilindros rectos circulares 𝑥2 + 𝑦2 = 𝑘2, el cono 𝑥2 + 𝑦2 = 𝑧2 y el hiperboloide 𝑥2 + 𝑦2 − 𝑧2 = 1. De modo similar, una ecuación de la forma 𝑓 (𝑥2+𝑧2, 𝑦) = 0 representa una superficie de revolución alrededor del eje 𝑦; y una ecuación de tipo 𝑓 (𝑦2 + 𝑧2, 𝑥) = 0 representa una superficie de revolución alrededor del eje 𝑥 . Elipsoides Un elipsoide es una superficie cerrada, de extensión finita, formada por la distorsión de una esfera en tres direcciones ortogonales. Sus cortes planas son elipses. La ecuación cuadrática: 𝑥2 𝑎2 + 𝑦 2 𝑏2 + 𝑧 2 𝑐2 = 1 (1.10) representa un elipsoide con centro en el origen y tres semiejes 𝑎 > 0, 𝑏 > 0, 𝑐 > 0. La ecuación (1.10) implica que 𝑥2 ⩽ 𝑎2, 𝑦2 ⩽ 𝑏2, 𝑧2 ⩽ 𝑐2. Esto significa que el elipsoide queda encerrado en la caja rectangular cuyos 8 vértices son (±𝑎,±𝑏,±𝑐). Hiperboloides Al cambiar uno o dos de los signos al lado izquierdo de (1.10), se obtiene otras super- ficies cuadráticas, llamados hiperboloides. Algunas de sus cortes planas son hipérbolas, otros son elipses. Con un solo signo negativo al lado izquierdo, se obtiene un hiperboloide de unmanto, una superficie no acotado pero conexo; por ejemplo: 𝑥2 𝑎2 + 𝑦 2 𝑏2 − 𝑧 2 𝑐2 = 1. (1.11) Con dos signos negativos al lado izquierdo, se obtiene un hiperboloide de dosmantos, una superficie no acotado y disconexo: 𝑧2 𝑐2 − 𝑥2 𝑎2 − 𝑦 2 𝑏2 = 1. (1.12) En este caso, 𝑧2/𝑐2 = 1 + 𝑥2/𝑎2 + 𝑦2/𝑏2 ⩾ 1, así que 𝑧 ⩾ 𝑐 o bien 𝑧 ⩽ −𝑐. La franja horizontal entre los dos planos paralelos 𝑧 = 𝑐 y 𝑧 = −𝑐 no contiene puntos de esta superficie. Por lo tanto, este hiperboloide queda separado en dos “mantos”. 1-12 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 Paraboloides Otros dos tipos de superficies cuadráticas son las paraboloides, que a su vez se dividen en dos clases. La superficie 𝑥2 𝑎2 + 𝑦 2 𝑏2 = 𝑧 (1.13) es un paraboloide elíptico: sus cortes por planos verticales son parábolas mientras sus cortes por planos horizontales o oblicuas son elipses. Un ejemplo de un paraboloide hiperbólico es la superficie 𝑥2 𝑎2 − 𝑦 2 𝑏2 = 𝑧. (1.14) Sus cortes por planos verticales son parábolas, pero sus cortes por planos horizontales o oblicuas son hipérbolas. Los ejemplos presentados en los ejemplos (1.10) a (1.14) son casos especiales de la ecuación cuadrática general en tres variables. Se puede obtener gran cantidad de otros ejemplos por cambios de coordenadas cartesianas (por ejemplo, traslación del origen o rotación del triedro de los ejes). Un sexto ejemplo es el cono elíptico: 𝑥2 𝑎2 + 𝑦 2 𝑏2 = 𝑧2 𝑐2 (1.15) que tiene un punto singular en el origen. Resulta que estos seis ejemplos tipifican las diversas cualidades geométricas de las superficies de segundo orden.3 1.4. Curvas en el espacio ℝ3 La trayectoria de una curva en el espacioℝ3 se parametriza por una función vectorial: ®𝒓 (𝑡) = (𝑥 (𝑡), 𝑦 (𝑡), 𝑧 (𝑡)), con 𝑡 ∈ ℝ. Las primeras dos derivadas de esta función dan la velocidad ®𝒗 (𝑡) y la aceleración ®𝒂 (𝑡) de esta trayectoria: ®𝒗 (𝑡) := ®𝒓 ′(𝑡) = (𝑥′(𝑡), 𝑦′(𝑡), 𝑧′(𝑡)), ®𝒂 (𝑡) = ®𝒗 ′(𝑡) := ®𝒓 ′′(𝑡) = (𝑥′′(𝑡), 𝑦′′(𝑡), 𝑧′′(𝑡)). 3Hay muchas aplicaciones gráficas aptas para trazar dibujos de estas superficies cuadráticas. Se reco- mienda, por ejemplo, la tabla ilustrada en la página 837 de libro: James Stewart, Cálculo en varias variables, 8a edición, Editorial Cengage, 2018. 1-13 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 La rapidez del recorrido es la longitud ∥®𝒓 ′(𝑡)∥ del vector de velocidad, ∥®𝒓 ′(𝑡)∥ := √︃ 𝑥′(𝑡)2 + 𝑦′(𝑡)2 + 𝑧′(𝑡)2. La longitud de arco de la curva, que se mide a partir de un punto ®𝒓 0 = ®𝒓 (𝑡0) – donde 𝑡0 = 0 en la mayoría de los casos – es la integral indefinida de la rapidez del recorrido: 𝑠 (𝑡) := ∫ 𝑡 𝑡0 ∥®𝒓 ′(𝜏)∥ 𝑑𝜏 . (1.16a) Por el teorema fundamental del cálculo, la derivada de 𝑠 (𝑡) es la rapidez: 𝑠′(𝑡) = ∥®𝒓 ′(𝑡)∥. (1.16b) En estos apuntes, siempre se supondrá que la parametrización ®𝒓 (𝑡) es regular. Esto quiere decir que la velocidad del recorrido nunca se anula: ®𝒓 ′(𝑡) ≠ ®0 para todo 𝑡 . Entonces el punto ®𝒓 (𝑡) avanza sobre la trayectoria,⁴ sin pausar ni detenerse (ni mucho menos retroceder por el camino). En consecuencia, la rapidez es siempre positiva: 𝑠′(𝑡) > 0 para todo 𝑡 . 𝑥 𝑦 𝑧 ®𝒓 (𝑡)®𝒓 ′′(𝑡) ®𝒓 ′(𝑡) • ◦ Figura 1.8: Una curva espiral, la hélice Ejemplo 1.5. La hélice ®𝒓 (𝑡) = (cos 3𝑡, sen 3𝑡, 4𝑡). Véase la Figura 1.8. Su velocidad es ®𝒓 ′(𝑡) = (−3 sen 3𝑡, 3 cos 3𝑡, 4). La rapidez del recorrido es ∥®𝒓 ′(𝑡)∥ = √︁ 9 sen2 3𝑡 + 9 cos2 3𝑡 + 16 = √ 9 + 16 = 5. 4Un detalle de terminología: la trayectoria de una curva es la totalidad de puntos de ℝ3 por donde pasa; la curva en sí incluye el recorrido (en función del tiempo) sobre esa trayectoria. Es útil imaginar la trayectoria como un alambre fino suspendido en el espacio, y sobre este alambre camina una hormiga pequeña; la curva es la historial de esa hormiga. 1-14 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 En este caso particular, el recorrido tiene rapidez constante, aunque la velocidad ®𝒓 ′(𝑡) no es constante, sino que cambia continuamente de dirección. La aceleración es ®𝒓 ′′(𝑡) = (−9 cos 3𝑡,−9 sen 3𝑡, 0), que es un vector horizontal dirigido hacia el eje 𝑧 (Figura 1.8). La longitud del arco, medida a partir de ®𝒓 (0) = (1, 0, 0), es 𝑠 (𝑡) := ∫ 𝑡 0 5𝑑𝜏 = 5𝑡 . Como 𝑡 = 𝑠/5, es posible reparametrizar la curva, usando 𝑠 como nuevo parámetro: ®𝒓 (𝑠) = ( cos 3𝑠 5 , sen 3𝑠 5 , 4𝑠 5 ) . Fíjese que cos2 3𝑡 + sen2 3𝑡 = 1, así que esta curva se describe en la superficie del cilindro 𝑥2 + 𝑦2 = 1. (La relación 𝑧 = 4𝑡 dice que la altura del punto ®𝒓 (𝑡) sube con un ritmo constante, proporcional a la velocidad angular de rotación de su “sombra” (cos 3𝑡, sen 3𝑡, 0) en el plano 𝑥𝑦.) Nótese también que 𝑑®𝒓 𝑑𝑠 = ( −3 5 sen 3𝑠 5 , 3 5 cos 3𝑠 5 , 4 5 ) , el cual es un vector de longitud 1 (es decir, un “vector unitario”). ♢ Ejemplo 1.6. La curva cúbica ®𝒓 (𝑡) = ( 𝑡, 𝑡2 √ 2 , 𝑡3 3 ) . Véase la Figura 1.9. Su velocidad es ®𝒓 ′(𝑡) = (1, √ 2 𝑡, 𝑡2). (1.17a) La rapidez del recorrido es ∥®𝒓 ′(𝑡)∥ = √ 1 + 2𝑡2 + 𝑡4 = 1 + 𝑡2, (1.17b) y la longitud de arco, medida a partir de ®𝒓 (0) = (0, 0, 0), es 𝑠 (𝑡) := ∫ 𝑡 0 (1 + 𝜏2) 𝑑𝜏 = 𝑡 + 1 3𝑡 3. Es posible despejar 𝑡 en términos de 𝑠, al resolver la ecuación 𝑡3 + 3𝑡 − 3𝑠 = 0, pero esto conduciría a fórmulas engorrosas para las componentes de ®𝒓 (𝑠). En general, no vale la pena despejar 𝑡 = 𝑡 (𝑠) explícitamente. 1-15 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 𝑥 𝑦 𝑧 ®𝒓 (𝑡) ®𝒓 ′(𝑡) ®𝒓 ′′(𝑡) • Figura 1.9: Una curva cúbica que pasa por el origen En todo caso, se debe notar que la función 𝑠 = 𝑠 (𝑡) es una función estrictamente creciente, al ser la integral de una función 𝑠′(𝑡) > 0. Una función creciente posee una función inversa, porque a cada valor de 𝑠 le corresponde un solo valor de 𝑡 . Es recomendable prescindir de la fórmula explícita para esta función inversa 𝑡 = 𝑡 (𝑠), porque se puede calcular las derivadas como 𝑑®𝒓 /𝑑𝑠 mediante la regla de la cadena: 𝑑®𝒓 𝑑𝑠 = 𝑑®𝒓 /𝑑𝑡 𝑑𝑠/𝑑𝑡 = ®𝒓 ′(𝑡) 𝑠′(𝑡) = ®𝒓 ′(𝑡) ∥®𝒓 ′(𝑡)∥ . Fíjese que este vector es unitario (es decir, su longitud es 1). Además, es un múltiplo del vector tangente ®𝒓 ′(𝑡). Conviene denotarlo por ®𝑻 (𝑡), el vector tangente unitario en el punto ®𝒓 (𝑡) de la curva: 𝑑®𝒓 𝑑𝑠 = ®𝑻 (𝑡) = ®𝒓 ′(𝑡) ∥®𝒓 ′(𝑡)∥ . (1.18) Para la curva cúbica en cuestión, del par de fórmulas (1.17) se obtiene en seguida: 𝑑®𝒓 𝑑𝑠 = ®𝑻 (𝑡) = ( 1 1 + 𝑡2 , √ 2 𝑡 1 + 𝑡2 , 𝑡2 1 + 𝑡2 ) , sin la necesidad de despejar 𝑡 en función de 𝑠. ♢ Ejemplo 1.7. La curva alabeada ®𝒓 (𝑡) = (2 cosh 3𝑡,−2 senh 3𝑡, 6𝑡). Véase la Figura 1.10. Su velocidad es ®𝒓 ′(𝑡) = (6 senh 3𝑡,−6 cosh 3𝑡, 6). La rapidez del recorrido es ∥®𝒓 ′(𝑡)∥ = √︁ 36 senh2 3𝑡 + 36 cosh2 3𝑡 + 36 = √︁ 72 cosh2 3𝑡 = 6 √ 2 cosh 3𝑡, al usar la fórmula cosh2 𝑥 = 1 + senh2 𝑥 . 1-16 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 𝑥 𝑦 𝑧 ®𝒓 (𝑡) ®𝒓 ′(𝑡) ®𝒓 ′′(𝑡) • • ◦ Figura 1.10: Una curva levemente alabeada La longitud de arco, a partir de ®𝒓 (0) = (2, 0, 0), es 𝑠 (𝑡) := ∫ 𝑡 0 6 √ 2 cosh 3𝜏 𝑑𝜏 = 2 √ 2 senh 3𝑡 . El vector tangente unitario es ®𝑻 (𝑡) = ®𝒓 ′(𝑡) ∥®𝒓 ′(𝑡)∥ = 1 6 √ 2 cosh 3𝑡 ®𝒓 ′(𝑡) = ( 1 √ 2 tanh 3𝑡, − 1 √ 2 , 1 √ 2 sech 3𝑡 ) . ⟦Para hallar este vector, no era necesario reparametrizar la curva en términos de 𝑠. En este caso, es factible cambiar de parámetro, porque la ecuación 𝑠 = 2 √ 2 senh2 3𝑡 admite la solución 𝑡 = 1 3 log(𝑠 + √ 𝑠2 + 8) − 1 2 log 2. Al sustituir esta expresión en ®𝒓 (𝑡), resulta ®𝒓 (𝑠) = (√︂ 𝑠2 + 8 2 , − 𝑠 √ 2 , 2 log(𝑠 + √ 𝑠2 + 8) − 3 log 2 ) . Se puede verificar ahora que las fórmulas para 𝑑®𝒓 /𝑑𝑠 y para ®𝑻 (𝑡) coinciden, al emplear una vez más la sustitución 𝑡 = 𝑡 (𝑠) de arriba; pero este es un cálculo arduo. En fin, es más aconsejable efectuar todos los cálculos en términos del parámetro original 𝑡 .⟧ ♢ La aceleración y sus componentes En términos del vector tangente unitario ®𝑻 (𝑡), la velocidad es simplemente ®𝒗 (𝑡) = ®𝒓 ′(𝑡) = 𝑠′(𝑡) ®𝑻 (𝑡). 1-17 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 La derivada de esta relación es, por la regla de producto, ®𝒂 (𝑡) = ®𝒓 ′′(𝑡) = 𝑠′′(𝑡) ®𝑻 (𝑡) + 𝑠′(𝑡) ®𝑻 ′(𝑡). (1.19) El segundo sumando a la derecha no es paralelo a la dirección tangente. Lejos de eso, resulta ser perpendicular a esa dirección. De hecho, como el vector tangente ®𝑻 (𝑡) tiene longitud constante (igual a 1) por su definición, así que ®𝑻 (𝑡) · ®𝑻 (𝑡) = ∥®𝑻 (𝑡)∥2 = 1, su derivada es cero:⁵ 𝑑 𝑑𝑡 (®𝑻 (𝑡) · ®𝑻 (𝑡)) = ®𝑻 ′(𝑡) · ®𝑻 (𝑡) + ®𝑻 (𝑡) · ®𝑻 ′(𝑡) = 2 ®𝑻 (𝑡) · ®𝑻 ′(𝑡) = 0. (1.20) Esto significa que el vector ®𝑻 ′(𝑡) es ortogonal (perpendicular) al vector tangente ®𝑻 (𝑡). Sin embargo, el vector derivado ®𝑻 ′(𝑡) no es unitario, en general. El vector de longitud 1 que apunta en esa dirección es el vector normal unitario, ®𝑵 (𝑡), definido por: ®𝑵 (𝑡) := ®𝑻 ′(𝑡) ∥®𝑻 ′(𝑡)∥ . (1.21) El vector de aceleración ®𝒂 (𝑡) es entonces, por la fórmula (1.19), una suma de dos pedazos, uno en la dirección tangente y otro en la dirección normal. Sus componentes en estas dos direcciones son 𝑎𝑇 (𝑡) := ®𝒂 (𝑡) · ®𝑻 (𝑡), 𝑎𝑁 (𝑡) := ®𝒂 (𝑡) · ®𝑵 (𝑡) . (1.22) La componente tangencial se obtiene inmediatamente de (1.19): 𝑎𝑇 (𝑡) = 𝑠′′(𝑡). Para calcular la componente normal 𝑎𝑁 (𝑡), es necesario examinar más de cerca la mag- nitud del vector ®𝑻 ′(𝑡). 5Nótese que aquí se ha aplicado la regla del producto a un producto de vectores, sin mayor explicación. Se invita al lector chequear que esto es válido, y análogamente para el producto cruz. Explícitamente, 𝑑 𝑑𝑡 ( ®𝒖 (𝑡) · ®𝒗 (𝑡) ) = ®𝒖 ′ (𝑡) · ®𝒗 (𝑡) + ®𝒖 (𝑡) · ®𝒗 ′ (𝑡) y también 𝑑 𝑑𝑡 ( ®𝒖 (𝑡) × ®𝒗 (𝑡) ) = ®𝒖 ′ (𝑡) × ®𝒗 (𝑡) + ®𝒖 (𝑡) × ®𝒗 ′ (𝑡). Es cuestión de expandir estas fórmulas en sus tres coordenadas cartesianas. 1-18 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 El triedro móvil {®𝑻 , ®𝑵 , ®𝑩} Se debe recordar que ®𝑻 (𝑡) = 𝑑®𝒓 /𝑑𝑠 es un vector unitario. Al derivarlo con respecto a 𝑠 en vez de 𝑡 , la regla de la cadena implica que 𝑑®𝑻 𝑑𝑠 = ®𝑻 ′(𝑡) 𝑠′(𝑡) . Entonces 𝑑®𝑻 /𝑑𝑠, que es proporcional a ®𝑻 ′(𝑡) y también a ®𝑵 (𝑡): apunta en la dirección normal a la curva. Se define la curvatura ^ (𝑡) de la curva, en el punto ®𝒓 (𝑡), como la longitud de ese vector: ^ (𝑡) := 𝑑®𝑻𝑑𝑠 = ∥®𝑻 ′(𝑡)∥ 𝑠′(𝑡) . (1.23) Esto dice, por un lado, que ∥®𝑻 ′(𝑡)∥ = ^ (𝑡) 𝑠′(𝑡); y por otro, que 𝑑®𝑻 𝑑𝑠 = ^ (𝑡) ®𝑵 (𝑡) , o bien, lo que es lo mismo, ®𝑻 ′(𝑡) = ^ (𝑡) 𝑠′(𝑡) ®𝑵 (𝑡). Vale la pena introducir un tercer vector unitario, para completar la descripción de la curva 𝑡 ↦→ ®𝒓 (𝑡). Como ®𝑻 (𝑡) y ®𝑵 (𝑡) son vectores unitarios y ortogonales, su producto cruz en un tercer vector unitario, ortogonal a ellos dos:⁶ ®𝑩 (𝑡) := ®𝑻 (𝑡) × ®𝑵 (𝑡) . (1.24) Este ®𝑩 (𝑡) se llama el vector binormal unitario a la curva en el punto ®𝒓 (𝑡). Para cada valor de 𝑡 , el juego de estos tres vectores {®𝑻 (𝑡), ®𝑵 (𝑡), ®𝑩 (𝑡)} es un triedro (dreiecks, en alemán), esto es, un triple de vectores unitarios y mutuamente ortogonales. Se puede considerarlo como sistema de referencia cartesiana, que difiere del sistema estándar {®𝚤, ®𝚥, ®𝒌 } por una rotación del espacio ambiente ℝ3. Su orientación en ℝ3 cambia con el avance del punto ®𝒓 (𝑡): por eso se habla del triedro móvil de la curva. 6La longitud del producto cruz de dos vectores en ℝ3 es dado por la fórmula ∥®𝒖 × ®𝒗 ∥ = ∥®𝒖 ∥ ∥®𝒗 ∥ | sen\ | donde \ es el ángulo entre ®𝒖 y ®𝒗 , determinado por ®𝒖 · ®𝒗 = ∥®𝒖 ∥ ∥®𝒗 ∥ cos\ . Si ®𝒖 , ®𝒗 son ortogonales, ®𝒖 · ®𝒗 = 0, entonces cos\ = 0 y por ende sen\ = ±1; en tal caso, se ve que ∥®𝒖 × ®𝒗 ∥ = ∥®𝒖 ∥ ∥®𝒗 ∥. 1-19 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 𝑥 𝑦 𝑧 ®𝒓 (𝑡) ®𝑻 (𝑡) ®𝑵 (𝑡) ®𝑩 (𝑡) • ◦ Figura 1.11: El triedro móvil de la hélice Ejemplo 1.8. La hélice ®𝒓 (𝑡) = (cos 3𝑡, sen 3𝑡, 4𝑡) de nuevo (continuación del Ejemplo 1.5). Se sabe que ®𝑻 (𝑡) = ®𝒓 ′(𝑡) ∥®𝒓 ′(𝑡)∥ = ®𝒓 ′(𝑡) 𝑠′(𝑡) = ( −3 5 sen 3𝑡, 3 5 cos 3𝑡, 4 5 ) . Entonces 𝑑®𝑻 𝑑𝑠 = ®𝑻 ′(𝑡) 𝑠′(𝑡) = ®𝑻 ′(𝑡) 5 = ( − 9 25 cos 3𝑡,− 9 25 sen 3𝑡, 0 ) . Su longitud es ^ (𝑡) = 9/25: la hélice tiene curvatura constante. Al dividir 𝑑®𝑻 /𝑑𝑠 por ^ (𝑡), se obtiene el vector normal unitario: ®𝑵 (𝑡) = (− cos 3𝑡,− sen 3𝑡, 0), que efectivamente es unitario y ortogonal a ®𝑻 (𝑡). Este vector es horizontal (su compo- nente 𝑧 es cero) y apunta hacia el eje 𝑧. ⟦Su negativo, − ®𝑵 (𝑡) = (cos 3𝑡, sen 3𝑡, 0), apunta hacia afuera.⟧ El vector binormal unitario es ®𝑩 (𝑡) = ®𝑻 (𝑡) × ®𝑵 (𝑡) = ������� ®𝚤 −3 5 sen 3𝑡 − cos 3𝑡 ®𝚥 3 5 cos 3𝑡 − sen 3𝑡 ®𝒌 4 5 0 ������� = ( 4 5 sen 3𝑡 ,−4 5 cos 3𝑡 , 3 5 ) . ♢ Observación. En el cálculo anterior del producto cruz, se empleó una notación de deter- minante 3 × 3. En general, su ®𝒖 = (𝑎, 𝑏, 𝑐) y ®𝒗 = (𝑝, 𝑞, 𝑟 ), se usa el formalismo: ®𝒖 × ®𝒗 = ������ ®𝚤 𝑎 𝑝 ®𝚥 𝑏 𝑞 ®𝒌 𝑐 𝑟 ������ = ®𝚤 (𝑏𝑟 − 𝑐𝑞) − ®𝚥 (𝑎𝑟 − 𝑐𝑝) + ®𝒌 (𝑎𝑞 − 𝑏𝑝) = (𝑏𝑟 − 𝑐𝑞, 𝑐𝑝 − 𝑎𝑟, 𝑎𝑞 − 𝑏𝑝). En la primera columna aparecen los vectores ®𝚤 = (1, 0, 0), ®𝚥 = (0, 1, 0), ®𝒌 = (0, 0, 1). 1-20 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 Ejemplo 1.9. La curva cúbica ®𝒓 (𝑡) = ( 𝑡, 𝑡2/ √ 2, 𝑡3/3 ) de nuevo (continuación del Ejem- plo 1.6). En este caso, 𝑠′(𝑡) = 1 + 𝑡2, por la fórmula (1.17b). Se obtuvo: ®𝑻 (𝑡) = ®𝒓 ′(𝑡) 𝑠′(𝑡) = ( 1 1 + 𝑡2 , √ 2 𝑡 1 + 𝑡2 , 𝑡2 1 + 𝑡2 ) . Entonces 𝑑®𝑻 𝑑𝑠 = ®𝑻 ′(𝑡) 𝑠′(𝑡) = ®𝑻 ′(𝑡) 1 + 𝑡2 = ( − 2𝑡 (1 + 𝑡2)3 , √ 2(1 − 𝑡2) (1 + 𝑡2)3 , 2𝑡 (1 + 𝑡2)3 ) . Este vector es (1 + 𝑡2)−3 veces (−2𝑡, √ 2(1 − 𝑡2), 2𝑡); en vista de que (−2𝑡,√2(1 − 𝑡2), 2𝑡) 2 = 4𝑡2 + 2(1 − 2𝑡2 + 𝑡4) + 4𝑡2 = 2(1 + 2𝑡2 + 𝑡4) = 2(1 + 𝑡2)2, la longitud del vector 𝑑®𝑻 /𝑑𝑠 es: ^ (𝑡) = 1 (1 + 𝑡2)3 √ 2(1 + 𝑡2) = √ 2 (1 + 𝑡2)2 . Al dividir 𝑑®𝑻 /𝑑𝑠 por ^ (𝑡), se obtiene el vector normal unitario: ®𝑵 (𝑡) = ( − √ 2𝑡 1 + 𝑡2 , 1 − 𝑡2 1 + 𝑡2 , √ 2𝑡 1 + 𝑡2 ) . En este caso, el vector binormal unitario es ®𝑩 (𝑡) = ®𝑻 (𝑡) × ®𝑵 (𝑡) = ( 𝑡2 1 + 𝑡2 ,− √ 2𝑡 1 + 𝑡2 , 1 1 + 𝑡2 ) . ♢ ▶ Volviendo al tema de las componentes tangencial y normal de la aceleración de la fórmula (1.22), ahora se puede expresarlos en términos de las funciones 𝑠 (𝑡) y ^ (𝑡): 𝑎𝑇 (𝑡) := ®𝒂 (𝑡) · ®𝑻 (𝑡) = 𝑠′′(𝑡), 𝑎𝑁 (𝑡) := ®𝒂 (𝑡) · ®𝑵 (𝑡) = ^ (𝑡) 𝑠′(𝑡)2. (1.25) En particular, si la rapidez 𝑠′(𝑡) es constante, como en el Ejemplo 1.5 de la hélice, entonces 𝑠′′(𝑡) = 0. Esto significa que la aceleración de la hélice es normal a la curva, ®𝒂 (𝑡) = 𝑎𝑁 (𝑡) ®𝑵 (𝑡); por eso, la aceleración es ortogonal a la velocidad. Lo mismo sucede el caso de movimiento circular uniforme en un plano (de ℝ3), en donde la aceleración es centrípeta, o sea, es un vector dirigido hacia el centro del círculo del recorrido. En cualquier otro caso, la aceleración tiene una componente tangencial no nula. 1-21 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 ⟦Para que la aceleración fuera puramente tangencial, sería necesario que 𝑎𝑁 (𝑡) = ^ (𝑡) 𝑠′(𝑡)2 = 0; y como 𝑠′(𝑡) > 0 siempre (por la regularidad de la parametrización), la curvatura debería ser cero: ^ (𝑡) = 0 para todo 𝑡 . De la fórmula (1.23), esto dice que ∥®𝑻 ′(𝑡)∥ = 0 y por ende ®𝑻 ′(𝑡) = ®0: el vector tangente unitario ®𝑻 (𝑡) sería constante. En otras términos, la curvatura es nula si y sólo si el vector tangente ®𝒓 ′(𝑡) siempre apunta en la misma dirección; se trata de un movimiento en línea recta (aunque puede variar la rapidez del recorrido).⟧ Ejemplo 1.10. La curva alabeada ®𝒓 (𝑡) = (2 cosh 3𝑡,−2 senh 3𝑡, 6𝑡), de nuevo (continua- ción del Ejemplo 1.7). Ya se calculó que 𝑠 (𝑡) = 2 √ 2 senh 3𝑡 ; 𝑠′(𝑡) = 6 √ 2 cosh 3𝑡 ; y ®𝑻 (𝑡) = ( 1 √ 2 tanh 3𝑡, − 1 √ 2 , 1 √ 2 sech 3𝑡 ) . Entonces 𝑑®𝑻 𝑑𝑠 = ®𝑻 ′(𝑡) 𝑠′(𝑡) = ®𝑻 ′(𝑡) 6 √ 2 cosh 3𝑡 = ( 1 4 sech 3 3𝑡, 0,−1 4 sech 2 3𝑡 tanh 3𝑡 ) . Al calcular la longitud de este vector, se obtiene: ^ (𝑡) = ∥𝑑®𝑻 /𝑑𝑠∥ = 1 4 sech 2 3𝑡 (sech 3𝑡, 0,− tanh 3𝑡) = 1 4 sech 2 3𝑡 . (Se obtuvo (sech 3𝑡, 0,− tanh 3𝑡) = 1 usando la fórmula sech2 𝑥 + tanh2 𝑥 = 1.) Como 𝑑®𝑻 /𝑑𝑠 = ^ (𝑡) ®𝑵 (𝑡), se deduce que el vector normal unitario es ®𝑵 (𝑡) = (sech 3𝑡, 0,− tanh 3𝑡). (Fíjese que este vector tiene longitud 1 por la misma fórmula.) Finalmente, el vector binormal unitario es: ®𝑩 (𝑡) = ®𝑻 (𝑡) × ®𝑵 (𝑡) = ������� ®𝚤 1√ 2 tanh 3𝑡 sech 3𝑡 ®𝚥 − 1√ 2 0 ®𝒌 1√ 2 sech 3𝑡 − tanh 3𝑡 ������� = ( 1 √ 2 tanh 3𝑡, 1 √ 2 , 1 √ 2 sech 3𝑡 ) . ♢ Curvatura y torsión Es posible emplear el vector binormal ®𝑩 (𝑡) para obtener una fórmula “directa” para la curvatura en términos de la parametrización 𝑡 ↦→ ®𝒓 (𝑡) de la curva. Usando las fórmulas (1.19) y (1.25), se puede calcular el producto cruz de la velocidad y la aceleración. 1-22 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 Se obtiene: ®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡) = 𝑠′(𝑡) ®𝑻 (𝑡) × ( 𝑠′′(𝑡) ®𝑻 (𝑡) + ^ (𝑡) 𝑠′(𝑡)2 ®𝑵 (𝑡) ) = 𝑠′(𝑡) 𝑠′′(𝑡) ®𝑻 (𝑡) × ®𝑻 (𝑡) + ^ (𝑡) 𝑠′(𝑡)3 ®𝑻 (𝑡) × ®𝑵 (𝑡) = ^ (𝑡) 𝑠′(𝑡)3 ®𝑩 (𝑡), (1.26) porque ®𝑻 (𝑡) × ®𝑻 (𝑡) = ®0. Como ∥ ®𝑩 (𝑡)∥ = 1, la longitud de este vector es ∥®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)∥ = ^ (𝑡) 𝑠′(𝑡)3 = ^ (𝑡) ∥®𝒓 ′(𝑡)∥3, (1.27) y de ahí resulta la fórmula para la curvatura antedicha: ^ (𝑡) = ∥®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)∥ ∥®𝒓 ′(𝑡)∥3 . (1.28) La fórmula (1.26) también ofrece un acceso directo al vector binormal. El producto cruz ®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡) resulta ser paralelo a ®𝑩 (𝑡): esto expresa que el vector binormal es perpendicular al plano que contiene la velocidad y la aceleración. Al dividir el producto cruz por su longitud – visible en la fórmula (1.27), se deduce que: ®𝑩 (𝑡) = ®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡) ∥®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)∥ . (1.29) ▶ Como el vector binormal ®𝑩 (𝑡) es de longitud constante 1, el cálculo (1.20) que se hizo para el vector ®𝑻 (𝑡) también muestra que la derivada ®𝑩 ′(𝑡) es ortogonal a ®𝑩 (𝑡): 2 ®𝑩 (𝑡) · ®𝑩 ′(𝑡) = ®𝑩 ′(𝑡) · ®𝑩 (𝑡) + ®𝑩 (𝑡) · ®𝑩 ′(𝑡) = 𝑑 𝑑𝑡 ( ®𝑩 (𝑡) · ®𝑩 (𝑡) ) = 0. Resulta ser más apropiado derivar con respecto a lo longitud de arco 𝑠 en vez del parámetro original 𝑡 . Como 𝑑 ®𝑩/𝑑𝑠 = ®𝑩 ′(𝑡)/𝑠′(𝑡) – por la regla de la cadena – ese vector también es ortogonal a ®𝑩 (𝑡). También se puede verificar eso con un cálculo directo:⁷ ®𝑩 · 𝑑 ®𝑩 𝑑𝑠 = 1 2 𝑑 𝑑𝑠 ( ®𝑩 · ®𝑩) = 1 2 𝑑 𝑑𝑠 (1) = 0. (1.30) Por otro lado, esta derivada 𝑑 ®𝑩/𝑑𝑠 es también ortogonal al vector ®𝑻 (𝑡): 𝑑 ®𝑩 𝑑𝑠 = 𝑑 𝑑𝑠 (®𝑻 × ®𝑵 ) = 𝑑 ®𝑻 𝑑𝑠 × ®𝑵 + ®𝑻 × 𝑑 ®𝑵 𝑑𝑠 = ®𝑻 × 𝑑 ®𝑵 𝑑𝑠 , ya que (𝑑®𝑻 /𝑑𝑠) × ®𝑵 = ^ ®𝑵 × ®𝑵 = ®0. 7En algunas fórmulas que siguen, se omite mención del parámetro 𝑡 , para aliviar la notación. 1-23 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 Entonces ®𝑻 · 𝑑 ®𝑩 𝑑𝑠 = ®𝑻 · ( ®𝑻 × 𝑑 ®𝑵 𝑑𝑠 ) = (®𝑻 × ®𝑻 ) · 𝑑 ®𝑵 𝑑𝑠 = ®0 · 𝑑 ®𝑵 𝑑𝑠 = 0. Como 𝑑 ®𝑩/𝑑𝑠 es ortogonal a ®𝑻 y a ®𝑩 , debe ser un múltiplo del tercer vector ®𝑵 del triedro móvil. Se introduce una función 𝜏 (𝑡), llamada la torsión de la curva en el punto ®𝒓 (𝑡), por esta definición: 𝑑 ®𝑩 𝑑𝑠 =: −𝜏 (𝑡) ®𝑵 (𝑡) . Ahora bien, el vector ®𝑵 (𝑡) también tiene longitud constante 1, y de nuevo 𝑑 ®𝑵 /𝑑𝑠 es ortogonal a ®𝑵 (usando (1.30) con ®𝑵 en lugar de ®𝑩). En consecuencia, 𝑑 ®𝑵 /𝑑𝑠 queda en el plano generado por los vectores ®𝑻 y ®𝑩 . No es difícil comprobar la relación 𝑑 ®𝑵 𝑑𝑠 = −^ (𝑡) ®𝑻 (𝑡) + 𝜏 (𝑡) ®𝑩 (𝑡), al aplicar 𝑑/𝑑𝑠 a las identidades ®𝑵 · ®𝑻 = 0 y ®𝑵 · ®𝑩 = 0. Es posible – y a veces es útil – resumir las relaciones ya calculadas para las derivadas de los vectores del triedro móvil en las siguientes fórmulas de Frenet y Serret: 𝑑®𝑻 𝑑𝑠 = ^ (𝑡) ®𝑵 , 𝑑 ®𝑵 𝑑𝑠 = −^ (𝑡) ®𝑻 + 𝜏 (𝑡) ®𝑩, 𝑑 ®𝑩 𝑑𝑠 = −𝜏 (𝑡) ®𝑵 . Alternativamente, se puede expresar estas ecuaciones diferenciales en forma matricial: 𝑑 𝑑𝑠  ®𝑻 ®𝑵 ®𝑩  =  0 ^ (𝑡) 0 −^ (𝑡) 0 𝜏 (𝑡) 0 −𝜏 (𝑡) 0   ®𝑻 ®𝑵 ®𝑩  . (1.31) Nótese que esta matriz de coeficientes es antisimétrica. De hecho, esto es de esperar, puesto que el triedro móvil cambia de un punto a otro por rotaciones, y cada “rotación infinitesimal” posee una matriz antisimétrica.⁸ 8La fórmula (1.31) representa un sistema de ecuaciones diferenciales de primer orden. Se puede eliminar el parámetro 𝑡 en favor del parámetro intrínseco 𝑠 al tomar 𝑡 = 𝑡 (𝑠), función inversa de la función creciente 𝑠 = 𝑠 (𝑡). Si las funciones ^ (𝑡 (𝑠)) y 𝜏 (𝑡 (𝑠)) son suaves, como en los ejemplos anteriores, hay un teorema que garantiza solución única a este sistema si se declara una condición inicial: el valor del triedro móvil {®𝑻 0, ®𝑵 0, ®𝑩0} en 𝑡 = 𝑡0. En consecuencia, si la curvatura ^ y la torsión 𝜏 están dadas de antemano, la curva queda determinada cerca del punto inicial, salvo por una rotación rígida de ℝ3 que modifica la posición inicial del triedro móvil. 1-24 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 Ejemplo 1.11. La curva alabeada ®𝒓 (𝑡) = (2 cosh 3𝑡,−2 senh 3𝑡, 6𝑡), una vez más (conti- nuación del Ejemplo 1.10). Ya se sabe que ®𝑩 (𝑡) = ( 1 √ 2 tanh 3𝑡 , 1 √ 2 , 1 √ 2 sech 3𝑡 ) . Entonces 𝑑 ®𝑩 𝑑𝑠 = ®𝑩 ′(𝑡) 𝑠′(𝑡) = ®𝑩 ′(𝑡) 6 √ 2 cosh 3𝑡 = ( 1 4 sech 3 3𝑡, 0,−1 4 sech 2 3𝑡 tanh 3𝑡 ) . También se ha visto que esta curva cumple: ®𝑵 (𝑡) = (sech 3𝑡, 0,− tanh 3𝑡), de modo que 𝑑 ®𝑩 𝑑𝑠 = 1 4 sech 2 3𝑡 ®𝑵 (𝑡), y de ahí se obtiene la torsión: 𝜏 (𝑡) = −1 4 sech 2 3𝑡 . Esta curva se caracteriza por la curiosa relación 𝜏 (𝑡) = −^ (𝑡); pero en casos más genera- les, los parámetros 𝜏 y ^ son independientes. ♢ ▶ Análogamente al caso de la curvatura ^ (𝑡), es posible obtener una fórmula “directa” para la torsión en términos de la parametrización 𝑡 ↦→ ®𝒓 (𝑡) de la curva. El punto de partida es la relación (1.26): ®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡) = ^ (𝑡) 𝑠′(𝑡)3 ®𝑩 (𝑡) . (1.26′) Como ®𝒓 ′′(𝑡) × ®𝒓 ′′(𝑡) = ®0 por propiedades del producto cruz, se ve que 𝑑 𝑑𝑡 ( ®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡) ) = ®𝒓 ′′(𝑡) × ®𝒓 ′′(𝑡) + ®𝒓 ′(𝑡) × ®𝒓 ′′′(𝑡) = ®𝒓 ′(𝑡) × ®𝒓 ′′′(𝑡), Al derivar el lado derecho de (1.26), se obtiene ®𝒓 ′(𝑡) × ®𝒓 ′′′(𝑡) = [ ^′(𝑡) 𝑠′(𝑡)3 + 3^ (𝑡) 𝑠′(𝑡)2 𝑠′′(𝑡) ] ®𝑩 (𝑡) + ^ (𝑡) 𝑠′(𝑡)3 ®𝑩 ′(𝑡). El primer término a la derecha es ortogonal tanto a ®𝑻 (𝑡) como a ®𝑵 (𝑡) y por ende es ortogonal a la aceleración ®𝒓 ′′(𝑡). Entonces: [®𝒓 ′(𝑡) × ®𝒓 ′′′(𝑡)] · ®𝒓 ′′(𝑡) = ^ (𝑡) 𝑠′(𝑡)3 ®𝑩 ′(𝑡) · ®𝒓 ′′(𝑡). El lado izquierdo es un producto triple de vectores: [®𝒓 ′(𝑡) × ®𝒓 ′′′(𝑡)] · ®𝒓 ′′(𝑡) = ®𝒓 ′′(𝑡) · [®𝒓 ′(𝑡) × ®𝒓 ′′′(𝑡)] = [®𝒓 ′′(𝑡) × ®𝒓 ′(𝑡)] · ®𝒓 ′′′(𝑡) = −[®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)] · ®𝒓 ′′′(𝑡). 1-25 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 Cabe recordar también la expresión para la aceleración: ®𝒓 ′′(𝑡) = ®𝒂 (𝑡) = 𝑠′′(𝑡) ®𝑻 (𝑡) + ^ (𝑡) 𝑠′(𝑡)2 ®𝑵 (𝑡). Como ®𝑩 ′(𝑡) = 𝑠′(𝑡) 𝑑 ®𝑩/𝑑𝑠 es paralela a ®𝑵 (𝑡) y ortogonal a ®𝑻 (𝑡), sólo la parte normal de ®𝒓 ′′(𝑡) es relevante: se obtiene [®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)] · ®𝒓 ′′′(𝑡) = − [®𝒓 ′(𝑡) × ®𝒓 ′′′(𝑡)] · ®𝒓 ′′(𝑡) = − ^ (𝑡) 𝑠′(𝑡)4 𝑑 ®𝑩 𝑑𝑠 · ^ (𝑡) 𝑠′(𝑡)2 ®𝑵 (𝑡) = + ^ (𝑡)2 𝑠′(𝑡)6 𝜏 (𝑡). En vista de la fórmula ∥®𝒓 ′(𝑡)×®𝒓 ′′(𝑡)∥ = ^ (𝑡) 𝑠′(𝑡)3, véase (1.27), esta relación proporciona la fórmula para la torsión requerida: 𝜏 (𝑡) = (®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)) · ®𝒓 ′′′(𝑡) ∥®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)∥2 . (1.32) Ejemplo 1.12. Considérese, por última vez, la curva cúbica ®𝒓 (𝑡) = ( 𝑡, 𝑡2 √ 2 , 𝑡3 3 ) del Ejemplo 1.6. Las primeras tres derivadas de ®𝒓 (𝑡) son: ®𝒓 ′(𝑡) = (1, √ 2 𝑡, 𝑡2), ®𝒓 ′′(𝑡) = (0, √ 2, 2𝑡), ®𝒓 ′′′(𝑡) = (0, 0, 2). Ya se sabe que ∥®𝒓 ′(𝑡)∥ = 1 + 𝑡2. Ahora se calcula ®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡) = ������ ®𝚤 1 0 ®𝚥 √ 2 𝑡 √ 2 ®𝒌 𝑡2 2𝑡 ������ = ®𝚤 ����√2 𝑡 √ 2 𝑡2 2𝑡 ���� − ®𝚥 ����1 0 𝑡2 2𝑡 ���� + ®𝒌 ���� 1 0√ 2 𝑡 √ 2 ���� = ( √ 2 𝑡2, −2𝑡, √ 2). Eso conduce a los siguientes cálculos: ∥®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)∥2 = 2𝑡4 + 4𝑡2 + 2 = 2(1 + 2𝑡2 + 𝑡4) = 2(1 + 𝑡2)2, [®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)] · ®𝒓 ′′′(𝑡) = ( √ 2 𝑡2, −2𝑡, √ 2) · (0, 0, 2) = 0 + 0 + 2 √ 2 = 2 √ 2. 1-26 MA–1003: Cálculo III 1.4. Curvas en el espacio ℝ3 La fórmulas (1.28) y (1.32) ahora dan la curvatura y la torsión: ^ (𝑡) = ∥®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)∥ ∥®𝒓 ′(𝑡)∥3 = √ 2(1 + 𝑡2) (1 + 𝑡2)3 = √ 2 (1 + 𝑡2)2 , 𝜏 (𝑡) = (®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)) · ®𝒓 ′′′(𝑡) ∥®𝒓 ′(𝑡) × ®𝒓 ′′(𝑡)∥2 = 2 √ 2 2(1 + 𝑡2)2 = √ 2 (1 + 𝑡2)2 . Esta curva obedece otra curiosa relación 𝜏 (𝑡) = +^ (𝑡), en contraste con la curva alabeada del Ejemplo 1.11. ♢ 1-27 MA–1003: Cálculo III 2 Derivadas parciales Ubi materia, ibi geometria. — Johannes Kepler1 2.1. Funciones de varias variables reales En este capítulo se abordará el cálculo diferencial de funciones de dos o más variables reales. Las funciones en cuestión serán diferenciables en cada variable por separado, lo que permite evaluar si más demora sus derivadas parciales. Derivadas parciales de primer orden Una función de dos variables reales se escribe 𝑧 = 𝑓 (𝑥,𝑦), con (𝑥,𝑦) ∈ ℝ2. Una función de tres variables reales es genéricamente de la forma 𝑤 = ℎ(𝑥,𝑦, 𝑧) con (𝑥,𝑦, 𝑧) ∈ ℝ3; etcétera. Aquí ‘𝑓 ’ o ‘ℎ’ significa simplemente la fórmula que combina las variables. Se dice que 𝑓 (𝑥,𝑦) es diferenciable en 𝑥,𝑦 por separado si: ⋄ para cada 𝑦0, la función de una variable 𝑥 ↦→ 𝑓 (𝑥,𝑦0) es diferenciable; y ⋄ para cada 𝑥0, la función de una variable 𝑦 ↦→ 𝑓 (𝑥0, 𝑦) es diferenciable. Se trata, pues, de dos funciones de una sola variable, cuyas derivadas se calculan con los procedimientos conocidos para funciones de una variable. Ejemplo 2.1. La función de dos variables 𝑓 (𝑥,𝑦) := 𝑥2𝑦 𝑥4 + 𝑦4 , (𝑥,𝑦) ≠ (0, 0) es obviamente diferenciable en 𝑥 para 𝑦 = 𝑦0 fijo, y diferenciable en 𝑦 para 𝑥 = 𝑦0 fijo; siempre que el denominador no sea cero – por eso se excluye (𝑥,𝑦) = (0, 0). Por la regla del cociente, se calculan: 𝑓𝑥 (𝑥,𝑦) ≡ 𝜕𝑓 𝜕𝑥 (𝑥,𝑦) = 2𝑥𝑦 (𝑥4 + 𝑦4) − 𝑥2𝑦 (4𝑥3) (𝑥4 + 𝑦4)2 = −2𝑥5𝑦 + 2𝑥𝑦5 (𝑥4 + 𝑦4)2 , 𝑓𝑦 (𝑥,𝑦) ≡ 𝜕𝑓 𝜕𝑦 (𝑥,𝑦) = 𝑥2(𝑥4 + 𝑦4) − 𝑥2𝑦 (4𝑦3) (𝑥4 + 𝑦4)2 = 𝑥6 − 3𝑥2𝑦4 (𝑥4 + 𝑦4)2 . En cada caso, se deriva 𝑓 (𝑥,𝑦) con respecto a una de las variables como si la otra variable fuera una constante. ♢ 1En su ensayo De fundamentis astrologiae certioribus, Praga, 1601. 2-1 MA–1003: Cálculo III 2.1. Funciones de varias variables reales En el Ejemplo anterior, aparecen dos notaciones – que son sinónimos – para las derivadas parciales. En vez de 𝑑 𝑓 /𝑑𝑡 para la derivada (ordinaria) de una función 𝑓 (𝑡) de una variable, se usa las notaciones alemanas 𝜕𝑓 /𝜕𝑥 y 𝜕𝑓 /𝜕𝑦 para las derivadas parciales. Por otra parte, en vez de la tradicional 𝑓 ′(𝑡) para la derivada ordinaria de 𝑓 (𝑡), se escribe las derivadas parciales con 𝑓𝑥 y 𝑓𝑦, en la notación inglesa.2 Esta es la definición precisa de las derivadas parciales de una función 𝑓 (𝑥,𝑦) en el punto (𝑥0, 𝑦0) de ℝ2: 𝑓𝑥 (𝑥0, 𝑦0) ≡ 𝜕𝑓 𝜕𝑥 (𝑥0, 𝑦0) := ĺım ℎ→0 𝑓 (𝑥0 + ℎ,𝑦0) − 𝑓 (𝑥0, 𝑦0) ℎ , (2.1a) 𝑓𝑦 (𝑥0, 𝑦0) ≡ 𝜕𝑓 𝜕𝑦 (𝑥0, 𝑦0) := ĺım 𝑘→0 𝑓 (𝑥0, 𝑦0 + 𝑘) − 𝑓 (𝑥0, 𝑦0) 𝑘 . (2.1b) Ejemplo 2.2. Tómese la función de tres variables ℎ(𝑥,𝑦, 𝑧) := 3𝑥𝑦2 + 𝑒𝑥 cos(𝑦𝑧) + 𝑥𝑧 . El término 𝑥𝑧 es problemático si 𝑥 < 0. Supongamos, entonces, que 𝑥 > 0, en cuyo caso se puede aprovechar la fórmula3 𝑥𝑧 = (𝑒 log𝑥 )𝑧 = 𝑒𝑧 log𝑥 . Esta función tiene tres derivadas parciales: 𝜕ℎ 𝜕𝑥 (𝑥,𝑦, 𝑧) ≡ ℎ𝑥 (𝑥,𝑦, 𝑧) = 3𝑦2 + 𝑒𝑥 cos(𝑦𝑧) + 𝑧𝑥𝑧−1, 𝜕ℎ 𝜕𝑦 (𝑥,𝑦, 𝑧) ≡ ℎ𝑦 (𝑥,𝑦, 𝑧) = 6𝑥𝑦 − 𝑒𝑥𝑧 sen(𝑦𝑧), 𝜕ℎ 𝜕𝑧 (𝑥,𝑦, 𝑧) ≡ ℎ𝑧 (𝑥,𝑦, 𝑧) = − 𝑒𝑥𝑦 sen(𝑦𝑧) + 𝑥𝑧 log𝑥 . En cada caso, se deriva ℎ(𝑥,𝑦, 𝑧) con respecto a una de las variables como si las otras dos variables fueran constantes. ♢ En las fórmulas (2.1), se toman límites “ordinarios” de funciones de una variable. También se puede definir límites en dos variables. Por ejemplo, dada una fórmula como 𝑓 (𝑥,𝑦) := (𝑥4 + 𝑦4)/(𝑥2 + 𝑦2), claramente bien definida fuera del origen de ℝ2, ¿como se debe definir 𝑓 (0, 0)? 2La “notación alemana”𝑑 𝑓 /𝑑𝑡 , etc., se debe a Gottfried Leibniz (a partir de 1684), mientras la “notación inglesa” 𝑓 ′ fue empleada por Isaac Newton, en sus manuscritos personales desde 1666, aunque tardó en usarlo en público por varios años. Las dos notaciones son útiles, aunque la “inglesa” es más compacta. 3En estos apuntes, ‘log’ denotará el logaritmo natural, log = log𝑒 ; antiguamente (antes de 1980, aprox.) se empleaba tablas de logaritmos con base 10 para ciertos cálculos aritméticos, pero ahora log10 es obsoleto. En los libros de texto de cálculo todavía es común ver la notación ‘ln’ para denotar el logaritmo natural, en homenaje a John Napier, autor del primer tratado sobre logaritmos en 1610. 2-2 MA–1003: Cálculo III 2.1. Funciones de varias variables reales Se plantea, entonces, interpretar la expresión: ĺım (𝑥,𝑦)→(0,0) 𝑥4 + 𝑦4 𝑥2 + 𝑦2 = ?? A lo largo de una recta 𝑦 =𝑚𝑥 , esto se reduce a un límite en una variable: ĺım 𝑥→0 (1 +𝑚4)𝑥4 (1 +𝑚2)𝑥2 = ĺım 𝑥→0 1 +𝑚4 1 +𝑚2 𝑥 2 = 0; y en la recta vertical 𝑥 = 0, se reduce a ĺım 𝑦→0 𝑦4 𝑦2 = ĺım 𝑦→0 𝑦2 = 0. Esto sugiere (pero no asegura) que el límite original debe ser 0. Una mejor táctica sería pasar la función original a coordenadas polares:{ 𝑥 = 𝑟 cos\ 𝑦 = 𝑟 sen\ } (2.2) para que el límite sobre una recta \ = constante sea: ĺım (𝑥,𝑦)→(0,0) 𝑥4 + 𝑦4 𝑥2 + 𝑦2 = ĺım 𝑟→0 𝑟4(cos4 \ + sen4 \ ) 𝑟2 = ĺım 𝑟→0 (cos4 \ + sen4 \ ) 𝑟2 = 0, donde se observa que el resultado no depende de \ . ⟦Pero el mismo procedimiento aplicado a la función 𝑔(𝑥,𝑦) := 𝑥𝑦 𝑥2 + 𝑦2 produce ĺım (𝑥,𝑦)→(0,0) 𝑥𝑦 𝑥2 + 𝑦2 = ĺım 𝑟→0 𝑟2 cos\ sen\ 𝑟2 = ĺım 𝑟→0 cos\ sen\ = cos\ sen\ (?!) Este intento fracasa porque el resultado depende de \ y no ofrece un valor único: por eso, el límite (𝑥,𝑦) → (0, 0) de 𝑥𝑦/(𝑥2 + 𝑦2) no existe.⟧ Derivadas direccionales y gradientes Las derivadas parciales (2.1) están asociados a las rectas𝑦 = 𝑦0 y𝑥 = 𝑥0 en el plano𝑥𝑦. Una variante importante es la derivada direccional de la función 𝑓 (𝑥,𝑦), en el punto (𝑥0, 𝑦0), a lo largo de la recta que pasa por (𝑥0, 𝑦0) en la dirección ®𝒖 = (cos𝛼, sen𝛼); véase la Figura 2.1. La ecuación paramétrica de esa recta es: 𝑥 = 𝑥0 + ℎ cos𝛼, 𝑦 = 𝑦0 + ℎ sen𝛼, (ℎ ∈ ℝ). 2-3 MA–1003: Cálculo III 2.1. Funciones de varias variables reales (𝑥0,𝑦0,0) (𝑥0,𝑦0,𝑧0) (𝑥0+ℎ cos𝛼,𝑦0+ℎ sen𝛼,0) 𝑧 = 𝑓 (𝑥,𝑦) • • • Figura 2.1: Recta tangente a un corte vertical de 𝑧 = 𝑓 (𝑥,𝑦) Se define esta derivada direccional así: 𝐷®𝒖 𝑓 (𝑥0, 𝑦0) := ĺım ℎ→0 𝑓 (𝑥0 + ℎ cos𝛼,𝑦0 + ℎ sen𝛼) − 𝑓 (𝑥0, 𝑦0) ℎ . Es posible dar una expresión más simple para esta cantidad, si se adopta la notación: 𝑚1 := 𝑓𝑥 (𝑥0, 𝑦0), 𝑚2 := 𝑓𝑦 (𝑥0, 𝑦0). (2.3) Entonces, si ®𝒓 (𝑡) := (𝑥0 + 𝑡 cos𝛼,𝑦0 + 𝑡 sen𝛼), la derivada direccional 𝐷®𝒖 𝑓 (𝑥0, 𝑦0) es la derivada en 𝑡 = 0 de la función 𝑡 ↦→ 𝑓 (®𝒓 (𝑡)). La regla de cadena para funciones de una variable muestra que⁴ 𝐷®𝒖 𝑓 (𝑥0, 𝑦0) =𝑚1 cos𝛼 +𝑚2 sen𝛼 = (𝑚1,𝑚2) · ®𝒖 . (2.4) En la Figura 2.1 se ve el significado geométrico de la derivada direccional. El grafo de la función 𝑓 (𝑥,𝑦) es una superficie 𝑧 = 𝑓 (𝑥,𝑦). En el plano del piso 𝑧 = 0 se traza la recta que pasa por (𝑥0, 𝑦0, 0) en la dirección horizontal de ®𝒖 . El corte vertical del grafo encima de esta recta es una curva que pasa por el punto (𝑥0, 𝑦0, 𝑧0), donde 𝑧0 = 𝑓 (𝑥0, 𝑦0). La recta tangente (roja) a esta curva tiene pendiente vertical𝑚 =𝑚1 cos𝛼 +𝑚2 sen𝛼 . Para calcular las derivadas parciales, entonces, basta conocer las derivadas parciales 𝑚1,𝑚2 en el punto (𝑥0, 𝑦0) y la dirección ®𝒖 = (cos𝛼, sen𝛼). Ejemplo 2.3. Hallar la derivada direccional de mayor pendiente a la función 𝑓 (𝑥,𝑦) := √︁ 𝑥2 + 𝑦2 en el punto (2,−1). Primero se calculan las derivadas parciales de 𝑓 : 𝑓𝑥 = 2𝑥 2 √︁ 𝑥2 + 𝑦2 = 𝑥√︁ 𝑥2 + 𝑦2 , 𝑓𝑦 = 2𝑦 2 √︁ 𝑥2 + 𝑦2 = 𝑦√︁ 𝑥2 + 𝑦2 . 4Esta fórmula se justificará en breve, en la Sección 2.3 que trata de la regla de cadena en general. 2-4 MA–1003: Cálculo III 2.1. Funciones de varias variables reales Luego hay que evaluarlas en (𝑥,𝑦) = (2,−1): 𝑚1 = 2 √ 5 , 𝑚2 = − 1 √ 5 . Entonces la derivada direccional en la dirección ®𝒖 = (cos𝛼, sen𝛼) es 𝑚 = 2 cos𝛼 − sen𝛼 √ 5 . Este valor𝑚 depende del ángulo 𝛼 . Para maximizarlo, se pone 𝑑𝑚 𝑑𝛼 = −2 sen𝛼 + cos𝛼 √ 5 = 0, y se resuelve 2 sen𝛼 + cos𝛼 = 0 para obtener tg𝛼 = −1 2 . Esta ecuación tiene dos soluciones en el ámbito −𝜋 < 𝛼 ⩽ 𝜋 , que son: ⋄ 𝛼 = arc tg(−1 2) = − arc tg( 12) ∈ (−𝜋 2 , 0), con sen𝛼 = −1/ √ 5 y cos𝛼 = +2/ √ 5; ⋄ 𝛼 = arc tg(−1 2) + 𝜋 = 𝜋 − arc tg( 12) ∈ ( 𝜋2 , 𝜋), con sen𝛼 = +1/ √ 5 y cos𝛼 = −2/ √ 5. En el primer caso, 𝑚 = (4 + 1)/5 = 5/5 = 1; en el segundo caso, 𝑚 = (−4 − 1)/5 = −5/5 = −1. Entonces el valor máximo de𝑚 es𝑚 = +1 en la dirección ®𝒖 = ( 2√ 5 ,− 1√ 5 ) . ♢ ▶ Para funciones de tres variables, la dirección de una recta es un vector en ℝ3 que se tomará siempre de longitud 1. Es preferible usar una notación vectorial. Entonces se define el gradiente de una función 𝑓 (𝑥,𝑦, 𝑧) como el vector de sus tres derivadas parciales:⁵ ®∇𝑓 (𝑥,𝑦, 𝑧) := ( 𝑓𝑥 (𝑥,𝑦, 𝑧), 𝑓𝑦 (𝑥,𝑦, 𝑧), 𝑓𝑧 (𝑥,𝑦, 𝑧) ) (2.5) o más brevemente, ®∇𝑓 = (𝑓𝑥 , 𝑓𝑦, 𝑓𝑧). Si ®𝒖 = (𝑎, 𝑏, 𝑐) es un vector unitario que marca la dirección de una recta que pasa por el punto (𝑥0, 𝑦0, 𝑧0), la fórmula análoga a (2.4) es: 𝐷®𝒖 𝑓 (𝑥0, 𝑦0, 𝑦0) = ®∇𝑓 (𝑥0, 𝑦0, 𝑧0) · ®𝒖 . (2.6) Esta es la combinación 𝑎𝑓𝑥 + 𝑏𝑓𝑦 + 𝑐 𝑓𝑧 evaluada en (𝑥0, 𝑦0, 𝑧0). Ejemplo 2.4. Hallar la derivada direccional de la función 𝑓 (𝑥,𝑦, 𝑧) := 𝑦 log(2𝑥 − 3𝑧) en el punto (2, 3, 1), en la dirección ®𝒖 = ( 1 2 , 1 2 , 1√ 2 ) . 5Algunos libros escriben grad 𝑓 en vez de ®∇𝑓 . Es importante recordar que este ‘grad 𝑓 ’ es un vector. 2-5 MA–1003: Cálculo III 2.1. Funciones de varias variables reales Primero se calculan las derivadas parciales de 𝑓 : 𝑓𝑥 = 2𝑦 2𝑥 − 3𝑧 , 𝑓𝑦 = log(2𝑥 − 3𝑧), 𝑓𝑧 = − 3𝑦 2𝑥 − 3𝑧 . Luego hay que evaluarlas en (𝑥,𝑦, 𝑧) = (2, 3, 1): ®∇𝑓 (2, 3, 1) = (6, 0,−9), usando log 1 = 0. Entonces la derivada direccional en la dirección indicada ®𝒖 = ( 1 2 , 1 2 , 1√ 2 ) es 𝐷®𝒖 𝑓 (2, 3, 1) = (6, 0,−9) · ( 1 2 , 1 2 , 1√ 2 ) = 3 − 9 √ 2 . ♢ Derivadas parciales de orden superior Las derivadas parciales 𝑓𝑥 , 𝑓𝑦 de una función 𝑓 (𝑥,𝑦) – si existen – son otras funciones de las variables (𝑥,𝑦) y se puede calcular sus propias derivadas. En principio, se debe considerar cuatro derivadas parciales de segundo orden: 𝑓𝑥𝑥 = 𝜕2𝑓 𝜕𝑥2 , 𝑓𝑥𝑦 = 𝜕2𝑓 𝜕𝑥 𝜕𝑦 , 𝑓𝑦𝑥 = 𝜕2𝑓 𝜕𝑦 𝜕𝑥 , 𝑓𝑦𝑦 = 𝜕2𝑓 𝜕𝑦2 . Ahora hay una maravillosa simplificación, que se podría llamar “el teorema fundamental del cálculo diferencial en varias variables”: si las derivadas mixtas 𝑓𝑥𝑦 y 𝑓𝑦𝑥 existen y son continuas, entonces necesariamente son iguales.⁶ En adelante, se asumirá esta propiedad sin más discusión.⁷ Ejemplo 2.5. Hallar las derivadas parciales de segundo orden de 𝑓 (𝑥,𝑦) := 𝑒2𝑥 cos 3𝑦. Las derivadas parciales de primer orden son: 𝑓𝑥 = 2𝑒2𝑥 cos 3𝑦, 𝑓𝑦 = −3𝑒2𝑥 sin 3𝑦. Derivando 𝑓𝑥 primero y después 𝑓𝑦, se llega a estas funciones: 𝑓𝑥𝑥 = 4𝑒2𝑥 cos 3𝑦, 𝑓𝑥𝑦 = −6𝑒2𝑥 sin 3𝑦; 𝑓𝑦𝑥 = −6𝑒2𝑥 sin 3𝑦, 𝑓𝑦𝑦 = −9𝑒2𝑥 cos 3𝑦. Así se confirma, en este caso, la predicción de que 𝑓𝑦𝑥 = 𝑓𝑥𝑦. ♢ 6Una función 𝑓 (𝑥,𝑦) es continua en el punto (𝑥0, 𝑦0) si ĺım(𝑥,𝑦)→(𝑥0,𝑦0 ) 𝑓 (𝑥,𝑦) = 𝑓 (𝑥0, 𝑦0); y se dice que “𝑓 es continua” si esto vale en cada punto de su dominio. Explicar este teorema en detalle exigiría estudiar límites con más detenimiento; en los ejemplos de este curso, todas las funciones consideradas serán continuas y tendrán derivadas parciales continuas de primer y segundo órdenes. 7La igualdad de derivadas parciales mixtas de segundo (o mayor) orden aparece los textos originales del cálculo infinitesimal, de Leonhard Euler, a partir de 1740; fue demostrada en detalle por Hermann Schwarz en 1873. (A veces se le atribuye – erróneamente – a Laurent Schwartz en el siglo XX.) 2-6 MA–1003: Cálculo III 2.2. Planos tangentes y rectas normales Para funciones de tres variables ℎ(𝑥,𝑦, 𝑧), hay un total de seis derivadas parciales de segundo orden, tres “puros” y tres “mixtos”: ℎ𝑥𝑥 , ℎ𝑥𝑦 = ℎ𝑦𝑥 , ℎ𝑥𝑧 = ℎ𝑧𝑥 , ℎ𝑦𝑦 , ℎ𝑦𝑧 = ℎ𝑧𝑦 , ℎ𝑧𝑧 . De igual manera, las derivadas parciales de tercer orden de 𝑓 (𝑥,𝑦) son cuatro: 𝑓𝑥𝑥𝑥 , 𝑓𝑥𝑥𝑦 = 𝑓𝑥𝑦𝑥 = 𝑓𝑦𝑥𝑥 , 𝑓𝑥𝑦𝑦 = 𝑓𝑦𝑥𝑦 = 𝑓𝑦𝑦𝑥 , 𝑓𝑦𝑦𝑦 . 2.2. Planos tangentes y rectas normales Dada una función 𝑓 (𝑥,𝑦) cuyas derivadas parciales de primer orden existen, su grafo es la superficie 𝑧 = 𝑓 (𝑥,𝑦). Hay un plano especial que pasa por el punto (𝑥0, 𝑦0, 𝑧0) del grafo, véase la Figura 2.1: 𝑧 − 𝑧0 =𝑚1(𝑥 − 𝑥0) +𝑚2(𝑦 − 𝑦0) (2.7) donde𝑚1 := 𝑓𝑥 (𝑥0, 𝑦0),𝑚2 := 𝑓𝑦 (𝑥0, 𝑦0), como antes. Se dice que la función 𝑓 es diferenciable en el punto (𝑥0, 𝑦0) si este plano es una buena aproximación a la superficie cerca del punto de contacto (𝑥0, 𝑦0, 𝑧0). ▶ Desde luego, es necesario precisar el significado de la nebulosa frase “buena aproxi- mación”. Conviene denotar 𝑅 := √︃ (𝑥 − 𝑥0)2 + (𝑦 − 𝑦0)2 la distancia entre los puntos (𝑥,𝑦), (𝑥0, 𝑦0) del dominio de 𝑓 . Las alturas 𝑧 de la superficie y del plano sobre el punto (𝑥,𝑦) son: 𝑓 (𝑥,𝑦), en contraste con 𝑧0 +𝑚1(𝑥 − 𝑥0) +𝑚2(𝑦 − 𝑦0), donde 𝑧0 = 𝑓 (𝑥0, 𝑦0). La aproximación es “buena” si la diferencia de alturas es pequeña en comparación con la separación horizontal 𝑅: 𝑓 (𝑥,𝑦) = 𝑓 (𝑥0, 𝑦0) +𝑚1(𝑥 − 𝑥0) +𝑚2(𝑦 − 𝑦0) + Y (𝑥,𝑦) 𝑅, (2.8) y se requiere que el error relativo Y (𝑥,𝑦) → 0 cuando 𝑅 → 0. Si eso sucede, se dice que el plano (2.7) es el plano tangente al grafo de 𝑓 en el punto (𝑥0, 𝑦0, 𝑧0). Dicho de otra manera: una función es diferenciable en un punto si esa función admite una “buena aproximación” por otra función de primer grado. Sin entrar en más detalle, se ve que es al menos necesario que las derivadas parciales en ese punto existen. 2-7 MA–1003: Cálculo III 2.2. Planos tangentes y rectas normales ▶ La recta que pasa por (𝑥0, 𝑦0, 𝑧0) perpendicular al plano tangente se llama la recta normal a la superficie en ese punto. La ecuación del plano tangente (2.7) se puede reacomodar así: 𝑚1(𝑥 − 𝑥0) +𝑚2(𝑦 − 𝑦0) − (𝑧 − 𝑧0) = 0. Al comparar este formato con la ecuación general (1.5a) de un plano que pasa por (𝑥0, 𝑦0, 𝑧0), se puede notar que un vector normal al plano tangente es: ®𝒏 = (𝑚1,𝑚2,−1). Entonces las ecuaciones de la recta normal – en su forma simétrica (1.6b) – son: 𝑥 − 𝑥0 𝑚1 = 𝑦 − 𝑦0 𝑚2 = 𝑧 − 𝑧0 −1 . (2.9) Ejemplo 2.6. Encontrar el plano tangente y la recta normal al paraboloide elíptico 𝑧 = 𝑥2 + 𝑦2 en el punto (1, 2, 5). En primer lugar, cabe notar que 5 = 12+22, así que el punto (1, 2, 5) es efectivamente un punto de esta superficie. Aquí 𝑧 = 𝑓 (𝑥,𝑦) donde 𝑓 (𝑥,𝑦) := 𝑥2 +𝑦2. El el punto (1, 2) del dominio de 𝑓 , resulta:{ 𝑓𝑥 = 2𝑥 𝑓𝑦 = 2𝑦 } =⇒ { 𝑚1 = 2 𝑚2 = 4 } en (𝑥0, 𝑦0) = (1, 2). Entonces el plano tangente en (𝑥0, 𝑦0, 𝑧0) = (1, 2, 5) es 2(𝑥 − 1) + 4(𝑦 − 2) − (𝑧 − 5) = 0, o bien 2𝑥 + 4𝑦 − 𝑧 = 5. La recta normal al paraboloide en ese mismo punto es: 𝑥 − 1 2 = 𝑦 − 2 4 = 𝑧 − 5 −1 ; o bien: 2𝑥 − 2 = 𝑦 − 2 = 20 − 4𝑧. ♢ ▶ ¿Qué hacer con las superficies que no son grafos de la forma 𝑧 = 𝑓 (𝑥,𝑦)? En adelante se ofrecerá una explicación del procedimiento que sigue; por ahora basta con exponer un algoritmo. Una superficie general está dada por una ecuación 𝐹 (𝑥,𝑦, 𝑧) = 𝑘, donde 𝑘 es alguna constante y se supondrá que 𝐹 tiene derivadas parciales de primer orden. (Las superficies cuadráticas de sección 1.3 son todas de esta forma.) 2-8 MA–1003: Cálculo III 2.2. Planos tangentes y rectas normales El plano tangente – si existe – a esta superficie en el punto (𝑥0, 𝑦0, 𝑧0) es dado por: 𝐴(𝑥 − 𝑥0) + 𝐵(𝑦 − 𝑦0) +𝐶 (𝑧 − 𝑧0) = 0, (2.10a) donde 𝐴 = 𝐹𝑥 (𝑥0, 𝑦0, 𝑧0), 𝐵 = 𝐹𝑦 (𝑥0, 𝑦0, 𝑧0), 𝐶 = 𝐹𝑧 (𝑥0, 𝑦0, 𝑧0); (2.10b) o lo que es lo mismo, (𝐴, 𝐵,𝐶) = ®∇𝐹 (𝑥0, 𝑦0, 𝑧0). (2.10c) La recta normal a la superficie en ese mismo punto es: 𝑥 − 𝑥0 𝐴 = 𝑦 − 𝑦0 𝐵 = 𝑧 − 𝑧0 𝐶 . Esto dice que el gradiente de 𝐹 da la dirección de la recta normal en el punto (𝑥0, 𝑦0, 𝑧0). (𝑥0,𝑦0,0) (𝑥0,𝑦0,𝑧0) 𝑧 = 𝑓 (𝑥,𝑦) • • Figura 2.2: Plano tangente a una superficie en un punto dado Los cortes verticales de la superficie por los planos 𝑦 = 𝑦0 (paralelo al plano 𝑥𝑧); y 𝑥 = 𝑥0 (paralelo al plano 𝑦𝑧) marcan dos curvas en la superficie, cuyas rectas tangentes en su punto común (𝑥0, 𝑦0, 𝑧0) determinan el plano tangente: véase la Figura 2.2. Si la superficie es un grafo 𝑧 = 𝑓 (𝑥,𝑦), las pendientes verticales de estas dos rectas tangentes son𝑚1 y𝑚2, respectivamente. Ejemplo 2.7. Hallar el plano tangente y la recta normal al elipsoide 𝑥2 𝑎2 + 𝑦 2 𝑏2 + 𝑧 2 𝑐2 = 3 en el punto (𝑎, 𝑏, 𝑐). Obsérvese que el lado izquierdo de la ecuación, evaluado en el punto (𝑎, 𝑏, 𝑐), vale 1 + 1 + 1 = 3, así que (𝑎, 𝑏, 𝑐) es de hecho un punto del elipsoide. 2-9 MA–1003: Cálculo III 2.3. La regla de la cadena En este caso, con 𝐹 (𝑥,𝑦, 𝑧) := 𝑥2 𝑎2 + 𝑦 2 𝑏2 + 𝑧 2 𝑐2 y 𝑘 = 3, se obtiene las derivadas parciales: 𝐹𝑥 = 2𝑥 𝑎2 , 𝐹𝑦 = 2𝑦 𝑏2 , 𝐹𝑧 = 2𝑧 𝑐2 , y sus valores en (𝑥0, 𝑦0, 𝑧0) = (𝑎, 𝑏, 𝑐) son 𝐴 = 2 𝑎 , 𝐵 = 2 𝑏 , 𝐶 = 2 𝑐 . Según el algoritmo expuesto arriba, el plano tangente en (𝑎, 𝑏, 𝑐) es 2 𝑎 (𝑥 − 𝑎) + 2 𝑏 (𝑦 − 𝑏) + 2 𝑐 (𝑧 − 𝑐) = 0 o bien, al llevar las constantes al lado derecho: 2𝑥 𝑎 + 2𝑦 𝑏 + 2𝑧 𝑐 = 2 + 2 + 2 o finalmente: 𝑥 𝑎 + 𝑦 𝑏 + 𝑧 𝑐 = 3. ⟦Este es obviamente un plano que pasa por (𝑎, 𝑏, 𝑐).⟧ La recta normal en (𝑎, 𝑏, 𝑐), cuya dirección es ®∇𝐹 (𝑎, 𝑏, 𝑐) = (2/𝑎, 2/𝑏, 2/𝑐), tiene las ecuaciones: 𝑎(𝑥 − 𝑎) 2 = 𝑏 (𝑦 − 𝑏) 2 = 𝑐 (𝑧 − 𝑐) 2 o bien: 𝑎𝑥 − 𝑎2 = 𝑏𝑦 − 𝑏2 = 𝑐𝑧 − 𝑐2. ♢ 2.3. La regla de la cadena Si 𝑠 ↦→ 𝑓 (𝑠) y 𝑡 ↦→ 𝑔(𝑡) son dos funciones diferenciables de una variable y si 𝑔(𝑡) queda en el dominio de 𝑓 , al menos para un intervalo de valores 𝑎 < 𝑡 < 𝑏, entonces la función compuesta 𝑡 ↦→ 𝑓 (𝑔(𝑡)) es también diferenciable para 𝑎 < 𝑡 < 𝑏. Su derivada es dada por la conocida regla de la cadena (en una variable): ℎ(𝑡) := 𝑓 (𝑔(𝑡)) =⇒ ℎ′(𝑡) = 𝑓 ′(𝑔(𝑡)) 𝑔′(𝑡), (2.11) válida para 𝑎 < 𝑡 < 𝑏. En esta sección se verá cómo extender esta regla a varios casos de funciones de más variables. 2-10 MA–1003: Cálculo III 2.3. La regla de la cadena Derivadas a lo largo de una curva El caso más sencillo es el de sustituir los valores de una curva plana ®𝒓 (𝑡) = (𝑥 (𝑡), 𝑦 (𝑡)) en una función de dos variables 𝑓 (𝑥,𝑦). De este modo se obtiene una función de una variable 𝑧 (𝑡) := 𝑓 (®𝒓 (𝑡)) ≡ 𝑓 (𝑥 (𝑡), 𝑦 (𝑡)) . En adelante, se va a suponer que la función 𝑓 es diferenciable en el punto (𝑥0, 𝑦0) – en el sentido de que el grafo 𝑧 = 𝑓 (𝑥,𝑦) está bien aproximado por un plano (tangente) en el punto (𝑥0, 𝑦0, 𝑧0), donde 𝑧0 := 𝑓 (𝑥0, 𝑦0). Según la fórmula (2.8), esto significa que⁸ 𝑧 (𝑡) − 𝑧0 =𝑚1(𝑥 (𝑡) − 𝑥0) +𝑚2(𝑦 (𝑡) − 𝑦0) + 𝐸 (𝑡) (𝑡 − 𝑡0), donde ĺım𝑡→𝑡0 𝐸 (𝑡) = 0. Aquí (𝑥0, 𝑦0) = (𝑥 (𝑡0), 𝑦 (𝑡0)) es un punto de la curva 𝑡 ↦→ ®𝒓 (𝑡). Si se divide la ecuación por (𝑡 − 𝑡0), se obtiene 𝑧 (𝑡) − 𝑧 (𝑡0) 𝑡 − 𝑡0 =𝑚1 𝑥 (𝑡) − 𝑥 (𝑡0) 𝑡 − 𝑡0 +𝑚2 𝑦 (𝑡) − 𝑦 (𝑡0) 𝑡 − 𝑡0 + 𝐸 (𝑡). En el límite 𝑡 → 𝑡0, como 𝐸 (𝑡) → 0, se obtiene la fórmula clave: 𝑧′(𝑡0) =𝑚1 𝑥 ′(𝑡0) +𝑚2𝑦 ′(𝑡0). O bien, más explícitamente: 𝑧′(𝑡0) = 𝑓𝑥 (𝑥0, 𝑦0) 𝑥′(𝑡0) + 𝑓𝑦 (𝑥0, 𝑦0) 𝑦′(𝑡0) . Este fórmula se simplifica, eliminando los subíndices 0, al aplicarlo a cada punto (𝑥 (𝑡), 𝑦 (𝑡)) de la curva donde 𝑓 (𝑥 (𝑡), 𝑦 (𝑡)) está definido. Se obtiene así la regla de la cadena para curvas: 𝑧′(𝑡) = 𝑓𝑥 (𝑥 (𝑡), 𝑦 (𝑡)) 𝑥′(𝑡) + 𝑓𝑦 (𝑥 (𝑡), 𝑦 (𝑡)) 𝑦′(𝑡). (2.12a) Es costumbre abreviarla aún más, al suprimir la mención de algunas variables, escri- biendo 𝑓 (𝑡) como abreviatura para 𝑓 (𝑥 (𝑡), 𝑦 (𝑡)): 𝑓 ′(𝑡) = 𝑓𝑥 𝑥′(𝑡) + 𝑓𝑦 𝑦′(𝑡). (2.12b) En la notación alemana tradicional, la regla de cadena para curvas se expresa así:⁹ 𝑑 𝑓 𝑑𝑡 = 𝜕𝑓 𝜕𝑥 𝑑𝑥 𝑑𝑡 + 𝜕𝑓 𝜕𝑦 𝑑𝑦 𝑑𝑡 . (2.12c) 8El término residual 𝐸 (𝑡) (𝑡 − 𝑡0) se obtiene como sigue. Según (2.8), el residuo tiene el formato de Y (𝑥 (𝑡), 𝑦 (𝑡)) 𝑅(𝑡), donde 𝑅(𝑡)/(𝑡 − 𝑡0) es acotado y Y (𝑥 (𝑡), 𝑦 (𝑡)) → 0 en el límite 𝑡 → 𝑡0. 9Nótese la distinción entre derivadas parciales como 𝜕𝑓 /𝜕𝑥 y derivadas de una variable, como 𝑑𝑥/𝑑𝑡 , bien visibles en la notación alemana. 2-11 MA–1003: Cálculo III 2.3. La regla de la cadena Si se comparan las fórmulas (2.11) (para funciones 𝑓 de una variable) y (2.12a) (para funciones 𝑓 de dos variables), son bastante similares: la mayor diferencia es la presencia de dos sumandos en la fórmula variables, ya que en el segunda caso 𝑓 tiene dos derivadas parciales. Ejemplo 2.8. Calcular la derivada 𝑧′(𝑡) de la función 𝑧 = 𝑥𝑦2 a lo largo del círculo ®𝒓 (𝑡) = (cos 𝑡, sen 𝑡). Es obvio que 𝑧𝑥 = 𝑦 2, 𝑧𝑦 = 2𝑥𝑦. Al aplicar la regla de cadena (2.12b), se calcula: 𝑧′(𝑡) = 𝑧𝑥 𝑥′(𝑡) + 𝑧𝑦 𝑦′(𝑡) = 𝑦2 𝑥′(𝑡) + 2𝑥𝑦 𝑦′(𝑡) = (sen2 𝑡) (− sen 𝑡) + (2 cos 𝑡 sen 𝑡) (cos 𝑡) = − sen3 𝑡 + 2 cos2 𝑡 sen 𝑡 . También es posible calcular 𝑧′(𝑡) por sustitución directa, sin emplear la regla de la cadena. Esto sirve como un chequeo sobre el cálculo anterior: 𝑧 (𝑡) = cos 𝑡 sen2 𝑡, 𝑧′(𝑡) = − sen3 𝑡 + (cos 𝑡) (2 sen 𝑡 cos 𝑡), usando la regla del producto en una variable. En la mayoría de los casos, esta sustitución directa conduce a cálculos más largos y tediosos que el uso de la regla de la cadena. ♢ (2𝜋𝑎,0) 𝑥 𝑦 (0,0) (𝜋𝑎,2𝑎) • • • ◦ Figura 2.3: Un arco de cicloide Ejemplo 2.9. El cicloide es la curva generado por un punto marcado sobre un círculo de radio 𝑎 que rueda hacia la derecha sobre el eje 𝑥 (Figura 2.3). Esta curva está parametrizada por:{ 𝑥 (𝑡) = 𝑎(𝑡 − sen 𝑡) 𝑦 (𝑡) = 𝑎(1 − cos 𝑡) } donde −∞ < 𝑡 < ∞. (2.13) Calcular la derivada 𝑧′(𝑡) de la función 𝑧 = 𝑥2 + 𝑦2 a lo largo de esta curva. 2-12 MA–1003: Cálculo III 2.3. La regla de la cadena Es claro que 𝑧𝑥 = 2𝑥 , 𝑧𝑦 = 2𝑦. Al aplicar la regla de cadena, se obtiene: 𝑧′(𝑡) = 𝑧𝑥 𝑥′(𝑡) + 𝑧𝑦 𝑦′(𝑡) = 2𝑥 𝑥′(𝑡) + 2𝑦 𝑦′(𝑡) = 2𝑎(𝑡 − sen 𝑡) 𝑎(1 − cos 𝑡) + 2𝑎(1 − cos 𝑡) (𝑎 sen 𝑡) = 2𝑎2𝑡 (1 − cos 𝑡) = 2𝑎2(𝑡 − 𝑡 cos 𝑡). Para mayor certeza, se puede ensayar la sustitución directa: 𝑧 (𝑡) = 𝑥2 + 𝑦2 = 𝑎2(𝑡 − sen 𝑡)2 + 𝑎2(1 − cos 𝑡)2 = 𝑎2(𝑡2 − 2𝑡 sen 𝑡 − 2 cos 𝑡 + 2); 𝑧′(𝑡) = 𝑎2(2𝑡 − 2 sen 𝑡 − 2𝑡 cos 𝑡 + 2 sen 𝑡) = 2𝑎2(𝑡 − 𝑡 cos 𝑡). Una vez más, se ha verificado una instancia de la regla de la cadena, al precio de efectuar un cálculo más extenso. ♢ ▶ También se puede derivar funciones de tres variables 𝐹 (𝑥,𝑦, 𝑧) a lo largo de una curva 𝑡 ↦→ ®𝒓 (𝑡) = (𝑥 (𝑡), 𝑦 (𝑡), 𝑧 (𝑡)) en ℝ3. Las fórmulas son análogas a las de (2.12), con la única diferencia que ahora hay tres sumandos al lado derecho. Para la derivada de la función compuesta 𝑡 ↦→ 𝐹 (𝑥 (𝑡), 𝑦 (𝑡), 𝑧 (𝑡)) se usa 𝐹 ′(𝑡) = 𝐹𝑥 𝑥′(𝑡) + 𝐹𝑦 𝑦′(𝑡) + 𝐹𝑧 𝑧′(𝑡) ≡ ®∇𝐹 · ®𝒓 ′(𝑡). En la notación alemana, esta fórmula se presenta así: 𝑑𝐹 𝑑𝑡 = 𝜕𝐹 𝜕𝑥 𝑑𝑥 𝑑𝑡 + 𝜕𝐹 𝜕𝑦 𝑑𝑦 𝑑𝑡 + 𝜕𝐹 𝜕𝑧 𝑑𝑧 𝑑𝑡 ≡ ®∇𝐹 · 𝑑®𝒓 𝑑𝑡 . Ejemplo 2.10. Hallar la derivada de 𝑤 = 𝑦𝑧2 − 𝑥3 a lo largo de la curva 𝑥 = 𝑒−𝑡 , 𝑦 = cos 𝑡, 𝑧 = 𝑡2𝑒−𝑡 . Fíjese que no hay restricción sobre el dominio de esta curva: ®𝒓 (𝑡) está definida para −∞ < 𝑡 < ∞. Para derivar la función 𝑤 (𝑡) := 𝑦 (𝑡)𝑧 (𝑡)2 − 𝑥 (𝑡)3, se calcula: ®∇𝑤 = (𝑤𝑥 ,𝑤𝑦,𝑤𝑧) = (−3𝑥2, 𝑧2, 2𝑦𝑧) = (−3𝑒−2𝑡 , 𝑡4𝑒−2𝑡 , 2𝑡2𝑒−𝑡 cos 𝑡), ®𝒓 ′(𝑡) = (−𝑒−𝑡 , − sen 𝑡, (2𝑡 − 𝑡2)𝑒−𝑡 ). De ahí se obtiene1⁰ 𝑤 ′(𝑡) = ®∇𝑤 · ®𝒓 ′(𝑡) = 3𝑒−3𝑡 − 𝑡4𝑒−2𝑡 sen 𝑡 + (4𝑡3 − 2𝑡4)𝑒−2𝑡 cos 𝑡 . ♢ 10En un producto de términos con un factor trigonométrico, es aconsejable escribir esta a la derecha: así, se prefiere 2𝑡2𝑒−𝑡 cos 𝑡 en vez de 2𝑡2 cos 𝑡𝑒−𝑡 . Sin paréntesis, la segunda expresión es ambigua. 2-13 MA–1003: Cálculo III 2.3. La regla de la cadena Cambio de variables El segundo caso de importancia de la regla de la cadena ocurre cuando se cambian las variables del dominio de una función de dos o más variables. El caso mejor conocido es el uso de coordenadas polares (2.2) en funciones de dos variables:{ 𝑥 = 𝑟 cos\ 𝑦 = 𝑟 sen\ } . (2.2′) Más generalmente, una transformación de las variables cartesianas a dos variables nuevas (𝑢, 𝑣) se puede expresar así: { 𝑥 = 𝑥 (𝑢, 𝑣) 𝑦 = 𝑦 (𝑢, 𝑣) } (2.14) donde se supondrá que 𝑥 (𝑢, 𝑣), 𝑦 (𝑢, 𝑣) son funciones diferenciables de las nuevas varia- bles. Si ahora 𝑓 (𝑥,𝑦) es una función diferenciable de las variables originales, estas expre- siones definen una nueva función: (𝑢, 𝑣) ↦−→ 𝑓 ( 𝑥 (𝑢, 𝑣), 𝑦 (𝑢, 𝑣) ) , (2.15) y se buscan sus derivadas parciales 𝑓𝑢 = 𝜕𝑓 /𝜕𝑢 y 𝑓𝑣 = 𝜕𝑓 /𝜕𝑣 . Al mantener constante una de las variables 𝑣,𝑢, se obtiene de las fórmulas (2.12) unas fórmulas análogas para las derivadas parciales de la función (2.15): 𝑓𝑢 = 𝑓𝑥 𝑥𝑢 + 𝑓𝑦 𝑦𝑢 𝑓𝑣 = 𝑓𝑥 𝑥𝑣 + 𝑓𝑦 𝑦𝑣 (2.16a) donde se suprimen los variables, para aliviar la notación. ⟦Pero es importante notar un detalle: las derivadas parciales 𝑥𝑢, 𝑦𝑢, 𝑥𝑣 , 𝑦𝑣 son funciones de (𝑢, 𝑣), mientras las derivadas parciales 𝑓𝑥 , 𝑓𝑦 son funciones de (𝑥,𝑦). En estas (𝑥,𝑦) es necesario sustituir la transforma- ción (2.14) para que los lados derechos de (2.16a) dependan solamente de (𝑢, 𝑣).⟧ La regla de cadena para el cambio de variable (2.14) se ve así en notación alemana: 𝜕𝑓 𝜕𝑢 = 𝜕𝑓 𝜕𝑥 𝜕𝑥 𝜕𝑢 + 𝜕𝑓 𝜕𝑦 𝜕𝑦 𝜕𝑢 , 𝜕𝑓 𝜕𝑣 = 𝜕𝑓 𝜕𝑥 𝜕𝑥 𝜕𝑣 + 𝜕𝑓 𝜕𝑦 𝜕𝑦 𝜕𝑣 . (2.16b) Ejemplo 2.11. Hallar las derivadas parciales 𝑧𝑟 , 𝑧\ de la función 𝑧 = 𝑥2 − 𝑦2 en coorde- nadas polares. Nótese primero que 𝑧𝑥 = 2𝑥 , 𝑧𝑦 = −2𝑦. 2-14 MA–1003: Cálculo III 2.3. La regla de la cadena En seguida, se dispone de las derivadas parciales de las fórmulas de cambio (2.2):{ 𝑥𝑟 = cos\, 𝑥\ = −𝑟 sen\ 𝑦𝑟 = sen\, 𝑦\ = 𝑟 cos\ } (2.17) y todos se combinan según la regla de la cadena (2.16a): 𝑧𝑟 = 𝑧𝑥 𝑥𝑟 + 𝑧𝑦 𝑦𝑟 = 2𝑥 (cos\ ) − 2𝑦 (sen\ ), 𝑧\ = 𝑧𝑥 𝑥\ + 𝑧𝑦 𝑦\ = 2𝑥 (−𝑟 sen\ ) − 2𝑦 (𝑟 cos\ ). Para terminar el cálculo, se debe enchufar las expresiones para 𝑥,𝑦 al lado derecho: 𝑧𝑟 = 2𝑟 cos\ (cos\ ) − 2𝑟 sen\ (sen\ ) = 2𝑟 (cos2 \ − sen2 \ ), 𝑧\ = 2𝑟 cos\ (−𝑟 sen\ ) − 2𝑟 sen\ (𝑟 cos\ ) = −4𝑟2 sen\ cos\ . Opcionalmente, se puede simplificar el resultado con identidades trigonométricas:11 𝑧𝑟 = 2𝑟 cos 2\, 𝑧\ = −2𝑟2 sen 2\ . ♢ A veces conviene expresar la regla de la cadena (2.16a) en el formato de un producto de matrices, así: [ 𝑓𝑢 𝑓𝑣 ] = [ 𝑓𝑥 𝑓𝑦 ] [ 𝑥𝑢 𝑥𝑣 𝑦𝑢 𝑦𝑣 ] . (2.18) Esta matriz 2 × 2 de derivadas parciales expresa la derivada del cambio de varia- bles (2.14). Ejemplo 2.12. Encontrar las derivadas parciales de la función 𝑧 = 𝑥2𝑦3 después del cambio de variable: { 𝑥 = 𝑢 − 𝑣2 𝑦 = 𝑢 + 2𝑣 } . En primer lugar: 𝑧𝑥 = 2𝑥𝑦3, 𝑧𝑦 = 3𝑥2𝑦2. Las derivadas parciales del cambio de variable son:{ 𝑥𝑢 = 1, 𝑥𝑣 = −2𝑣 𝑦𝑢 = 1, 𝑦𝑣 = 2 } . Por lo tanto: [ 𝑧𝑢 𝑧𝑣 ] = [ 2𝑥𝑦3 3𝑥2𝑦2 ] [ 1 −2𝑣 1 2 ] = [ 𝑥𝑦2(2𝑦 + 3𝑥) 2𝑥𝑦2(−2𝑣𝑦 + 3𝑥) ] . 11En este ejemplo, una sustitución directa da 𝑧 = 𝑟2(cos2 \ − sen2 \ ) = 𝑟2 cos 2\ , la cual permite verificar esta aplicación de la regla de la cadena. 2-15 MA–1003: Cálculo III 2.3. La regla de la cadena Es necesario convertir las expresiones al lado derecho a funciones de 𝑢, 𝑣 solamente, eliminando las variables 𝑥,𝑦. Se obtiene: 𝑧𝑢 = (𝑢 − 𝑣2) (𝑢 + 2𝑣)2(5𝑢 + 4𝑣 − 3𝑣2), 𝑧𝑣 = 2(𝑢 − 𝑣2) (𝑢 + 2𝑣)2(3𝑢 − 2𝑢𝑣 − 7𝑣2). ♢ Derivación con dependencia mixta A veces es necesario, después de hacer un cambio de variable, obtener derivadas parciales de una función que se expresa en términos de las variables nuevas y las variables originales simultáneamente. Es mejor ilustrar este fenómeno con un ejemplo. Ejemplo 2.13. Si 𝑤 (𝑥,𝑦) := 𝑢2 + 𝑣2 + 𝑥2 + 𝑦2 donde estas variables están ligadas por las relaciones: { 𝑢 = 𝑥 − 𝑦 𝑣 = 𝑥 + 𝑦 } , se debe hallar las derivadas parciales de 𝑤 con respecto a 𝑥,𝑦. Este enunciado es levemente ambigua, porque se puede atribuir dos significados a “la derivada parcial de𝑤 con respecto a 𝑥”. Se trata de la derivada parcial “directa”, que sería 2𝑥 , como si 𝑢, 𝑣, 𝑥,𝑦 fueran 4 variables independientes? O bien, se quiere derivar la función 𝑥 ↦→ (𝑥 − 𝑦)2 + (𝑥 + 𝑦)2 + 𝑥2 + 𝑦2, después de resolver las dependencias? Se prefiere la segunda opción: esto es 𝑤𝑥 = 𝜕𝑤/𝜕𝑥 . Pero en el transcurso del cálculo se llamará ¤𝑤𝑥 a la primera opción; en el ejemplo, ¤𝑤𝑥 = 2𝑥 . A la derecha se ve el grafo de las dependencias de las variables: cada arista (de arriba hacia abajo) indica una dependencia directa. Así, las variables inferiores 𝑥,𝑦 son independientes; las variables intermedios𝑢, 𝑣 dependen de 𝑥,𝑦; y la variable superior𝑤 depende directamente de las otras cuatro. 𝑢 𝑣 𝑤 𝑥 𝑦 La regla de la cadena se describe así en términos del grafo de dependencias: para calcular 𝑤𝑥 , se cuenta un sumando para cada camino ascendente de 𝑥 a 𝑤 . En el grafo, se ven tres caminos ascendentes: uno directo de 𝑥 a𝑤 ; y dos indirectos, pasando por 𝑢 y 𝑣 , respectivamente. Igual sucede con las variables 𝑦 y 𝑤 . Entonces se usan las fórmulas: 𝑤𝑥 = ¤𝑤𝑥 +𝑤𝑢 𝑢𝑥 +𝑤𝑣 𝑣𝑥 𝑤𝑦 = ¤𝑤𝑦 +𝑤𝑢 𝑢𝑦 +𝑤𝑣 𝑣𝑦 para calcular las derivadas parciales requeridos. Concretamente: 𝑤𝑥 = 2𝑥 + (2𝑢) (1) + (2𝑣) (1) = 2𝑥 + (2𝑥 − 2𝑦) + (2𝑥 + 2𝑦) = 6𝑥, 𝑤𝑦 = 2𝑦 + (2𝑢) (−1) + (2𝑣) (1) = 2𝑦 + (−2𝑥 + 2𝑦) + (2𝑥 + 2𝑦) = 6𝑦. ♢ 2-16 MA–1003: Cálculo III 2.4. Derivación implícita 2.4. Derivación implícita Si una superficie está definida por una relación del tipo: 𝐹 (𝑥,𝑦, 𝑧) = 𝑘, (2.19) muchas veces – pero no siempre – es posible despejar una de las tres variables en términos de las otras; en cuyo caso se obtendrá una expresión tal como 𝑧 = 𝑔(𝑥,𝑦). Si eso resulta posible, se obtiene las derivadas parciales 𝑧𝑥 = 𝑔𝑥 (𝑥,𝑦), 𝑧𝑦 = 𝑔𝑦 (𝑥,𝑦) en forma directa. Cuando es imposible (o resulta incómodo) despejar 𝑧 con una fórmula explícita, se dice que la relación (2.19) determina 𝑧 de manera implícita. Entonces es necesario hallar 𝑧𝑥 , 𝑧𝑦 indirectamente, a partir de las derivadas calculables 𝐹𝑥 , 𝐹𝑦, 𝐹𝑧. Este es el problema de la derivación implícita. Al denotar el lado izquierdo de (2.19) por𝑤 := 𝐹 (𝑥,𝑦, 𝑧), se plantea un problema de dependencia mixta: se consideran 𝑥,𝑦 como varia- bles independientes; la variable 𝑧 depende implícitamente de 𝑥,𝑦; y la variable 𝑤 depende de las otras tres. En el grafo al lado quedan ilustradas estas dependencias. 𝑤 𝑥 𝑦 𝑧 La relación 𝑤 = 𝑘 dada por (2.19) implica que 𝑤𝑥 = 0, 𝑤𝑦 = 0. Entonces la regla de la cadena en este caso produce: 𝑤𝑥 = ¤𝑤𝑥 +𝑤𝑧 𝑧𝑥 ≡ 𝐹𝑥 + 𝐹𝑧 𝑧𝑥 = 0, 𝑤𝑦 = ¤𝑤𝑦 +𝑤𝑧 𝑧𝑦 ≡ 𝐹𝑦 + 𝐹𝑧 𝑧𝑦 = 0, (2.20a) porque aquí ¤𝑤𝑥 significa la derivada parcial ordinaria 𝐹𝑥 , de 𝐹 con respecto a 𝑥; y de igual modo ¤𝑤𝑦 = 𝐹𝑦. Cuando 𝐹𝑧 ≠ 0, estas ecuaciones permiten despejar 𝑧𝑥 , 𝑧𝑦: 𝑧𝑥 = −𝐹𝑥 𝐹𝑧 , 𝑧𝑦 = − 𝐹𝑦 𝐹𝑧 . (2.20b) Atención a los signos negativos, que aparecen al resolver las ecuaciones (2.20a). En la notación alemana, estas fórmulas tienen el formato: 𝜕𝑧 𝜕𝑥 = −𝜕𝐹/𝜕𝑥 𝜕𝐹/𝜕𝑧 , 𝜕𝑧 𝜕𝑦 = −𝜕𝐹/𝜕𝑦 𝜕𝐹/𝜕𝑧 . (2.20c) ⟦Una “cancelación formal” de los ‘𝜕𝐹 ’ dejaría los signos negativos sin explicación!⟧ 2-17 MA–1003: Cálculo III 2.4. Derivación implícita Ejemplo 2.14. Calcular 𝜕𝑧/𝜕𝑥 , 𝜕𝑧/𝜕𝑦 para puntos del elipsoide 𝑥2 𝑎2 + 𝑦 2 𝑏2 + 𝑧 2 𝑐2 = 3, y evaluarlas en el punto (𝑎, 𝑏, 𝑐). En el Ejemplo 2.7, se calcularon las derivadas parciales del lado izquierdo: 𝐹𝑥 = 2𝑥 𝑎2 , 𝐹𝑦 = 2𝑦 𝑏2 , 𝐹𝑧 = 2𝑧 𝑐2 . De ahí resulta: 𝑧𝑥 = −𝐹𝑥 𝐹𝑧 = −2𝑥/𝑎2 2𝑧/𝑐2 = −𝑐 2𝑥 𝑎2𝑧 ; 𝑧𝑦 = − 𝐹𝑦 𝐹𝑧 = −2𝑦/𝑏2 2𝑧/𝑐2 = −𝑐 2𝑦 𝑏2𝑧 . Es importante notar dos casos. Primero, los resultados son expresiones en las tres variables (𝑥,𝑦, 𝑧) en vez de (𝑥,𝑦) solamente. Eso está en la naturaleza de las cosas, puesto que no se ha despejado 𝑧 en términos de las otras dos. Segundo: las fórmulas para 𝑧𝑥 , 𝑧𝑦 no son válidas cuando 𝐹𝑧 = 0, en este caso, cuando 𝑧 = 0. Pero tampoco se puede despejar 𝑧 sin ambigüedad cuando 𝑧 = 0. En efecto, de la ecuación del elipsoide se obtiene 𝑧2 = 3𝑐2 − (𝑐2/𝑎2)𝑥2 − (𝑐2/𝑏2)𝑦2 =⇒ 𝑧 = ± √︃ 3𝑐2 − (𝑐2/𝑎2)𝑥2 − (𝑐2/𝑏2)𝑦2, donde los dos signos ± corresponden a dos hemielipsoides, uno superior y otro inferior. En los puntos de la elipse 𝑧 = 0, 𝑥2/𝑎2 + 𝑦2/𝑏2 = 3, el plano tangente es vertical. En el punto (𝑎, 𝑏, 𝑐) del primer octante de ℝ3, se obtiene los valores𝑚1 = −𝑐2𝑎/𝑎2𝑐 = −𝑐/𝑎;𝑚2 = −𝑐2𝑏/𝑏2𝑐 = −𝑐/𝑏. Entonces el plano tangente (2.7) es 𝑧 − 𝑐 = −(𝑐/𝑎) (𝑥 − 𝑎) − (𝑐/𝑏) (𝑦 − 𝑏) o bien 𝑥 𝑎 + 𝑦 𝑏 + 𝑧 𝑐 = 1 + 1 + 1 = 3, consistente con el resultado del Ejemplo 2.7. ♢ Del Ejemplo anterior también se ve cómo justificar las fórmulas (2.10) para el plano tangente en un punto de la superficie 𝐹 (𝑥,𝑦, 𝑧) = 𝑘. Si se despeja 𝑧 = 𝑧 (𝑥,𝑦) cerca del punto (𝑥0, 𝑦0), y se escribe 𝑧0 = 𝑧 (𝑥0, 𝑦0), entonces 𝐹 (𝑥0, 𝑦0, 𝑧0) = 𝑘; y además, como 𝑚1 := 𝑧𝑥 (𝑥0, 𝑦0), 𝑚2 := 𝑧𝑦 (𝑥0, 𝑦0), 2-18 MA–1003: Cálculo III 2.4. Derivación implícita la fórmula de derivación implícita (2.20b) conlleva los valores 𝑚1 = −𝐴 𝐶 , 𝑚2 = −𝐵 𝐶 [al menos cuando 𝐶 = 𝐹𝑧 (𝑥0, 𝑦0, 𝑧0) ≠ 0]. El plano tangente en (𝑥0, 𝑦0, 𝑧0) ahora es: 𝑧 − 𝑧0 = −𝐴 𝐶 (𝑥 − 𝑥0) − 𝐵 𝐶 (𝑦 − 𝑦0) y se simplifica en la forma ya vista: 𝐴(𝑥 − 𝑥0) + 𝐵(𝑦 − 𝑦0) +𝐶 (𝑧 − 𝑧0) = 0. (2.10a′) Derivación implícita con más variables La derivación implícita puede usarse para calcular derivadas parciales cuando dos o más variables están definidas implícitamente. Esta situación se presenta cuando se enfrentan 2 relaciones entre 4 variables: 𝐹 (𝑥,𝑦,𝑢, 𝑣) = 𝑘, 𝐺 (𝑥,𝑦,𝑢, 𝑣) = 𝑙 . (2.21) Se puede tomar dos de esta variables, tales como 𝑥,𝑦, como “independientes” y se pre- tende despejar las otras en funciones de esas: 𝑢 = 𝑢 (𝑥,𝑦), 𝑣 = 𝑣 (𝑥,𝑦). Habrá que obtener las derivadas 𝑢𝑥 = 𝜕𝑢/𝜕𝑥 , etcétera, de ser posibles sin resolver para 𝑢, 𝑣 explícitamente. Ejemplo 2.15. Hallar las derivadas parciales 𝑢𝑥 , 𝑢𝑦, 𝑣𝑥 , 𝑣𝑦, cuando las variables 𝑥,𝑦,𝑢, 𝑣 cumplen las dos relaciones: 𝑢3 + 𝑥𝑣 = 𝑦, 𝑣3 + 𝑦𝑢 = 𝑥 . Como las variables 𝑢, 𝑣 satisfacen ecuaciones cúbicas entrelazadas, es impensable despejarlas directamente. Primero se debe expresar estas ecuaciones en el formato (2.21), al llevar todas las variables al lado izquierdo: 𝐹 (𝑥,𝑦,𝑢, 𝑣) := 𝑢3 + 𝑥𝑣 − 𝑦 = 0, 𝐺 (𝑥,𝑦,𝑢, 𝑣) := 𝑣3 + 𝑦𝑢 − 𝑥 = 0. Esta vez el diagrama de dependencias tiene tres niveles: abajo, las variables independientes 𝑥,𝑦; en el intermedio, las variables dependientes 𝑢, 𝑣; y en el nivel superior, las expresiones 𝐹,𝐺 . 𝐹 𝐺 𝑢 𝑣 𝑥 𝑦 Las relaciones 𝐹 = 0,𝐺 = 0 implican 𝐹𝑥 = 0,𝐺𝑥 = 0, por un lado; y 𝐹𝑦 = 0,𝐺𝑦 = 0, por otro lado. Se calculan estas derivadas parciales 𝐹𝑥 , 𝐺𝑥 , 𝐹𝑦, 𝐺𝑦 con la regla de la cadena para dependencias mixtas, al partir de este cuadro. Esto da lugar a cuatro ecuaciones que involucran 𝑢𝑥 , 𝑢𝑦, 𝑣𝑥 , 𝑣𝑦: 2-19 MA–1003: Cálculo III 2.4. Derivación implícita 3𝑢2𝑢𝑥 + 𝑣 + 𝑥𝑣𝑥 = 0, 3𝑢2𝑢𝑦 + 𝑥𝑣𝑦 − 1 = 0, 3𝑣2𝑣𝑥 + 𝑦𝑢𝑥 − 1 = 0, 3𝑣2𝑣𝑦 + 𝑢 + 𝑦𝑢𝑦 = 0. Estas se pueden organizan en un par de sistemas 2 × 2 de ecuaciones:12[ 3𝑢2 𝑥 𝑦 3𝑣2 ] [ 𝑢𝑥 𝑣𝑥 ] = [ −𝑣 1 ] , [ 3𝑢2 𝑥 𝑦 3𝑣2 ] [ 𝑢𝑦 𝑣𝑦 ] = [ 1 −𝑢 ] , con la misma matriz 2 × 2 de coeficientes. Hay una fórmula conocida para la matriz inversa 2 × 2: [ 𝑎 𝑏 𝑐 𝑑 ]−1 = 1 𝑎𝑑 − 𝑏𝑐 [ 𝑑 −𝑏 −𝑐 𝑎 ] . De este modo se obtiene[ 𝑢𝑥 𝑣𝑥 ] = 1 9𝑢2𝑣2 − 𝑥𝑦 [ 3𝑣2 −𝑥 −𝑦 3𝑢2 ] [ −𝑣 1 ] = 1 9𝑢2𝑣2 − 𝑥𝑦 [ −3𝑣3 − 𝑥 3𝑢2 + 𝑦𝑣 ] ,[ 𝑢𝑦 𝑣𝑦 ] = 1 9𝑢2𝑣2 − 𝑥𝑦 [ 3𝑣2 −𝑥 −𝑦 3𝑢2 ] [ 1 −𝑢 ] = 1 9𝑢2𝑣2 − 𝑥𝑦 [ 3𝑣2 + 𝑥𝑢 −3𝑢3 − 𝑦 ] . El resultado final es: 𝑢𝑥 = − 3𝑣3 + 𝑥 9𝑢2𝑣2 − 𝑥𝑦 , 𝑣𝑥 = 3𝑢2 + 𝑦𝑣 9𝑢2𝑣2 − 𝑥𝑦 , 𝑢𝑦 = 3𝑣2 + 𝑥𝑢 9𝑢2𝑣2 − 𝑥𝑦 , 𝑣𝑦 = − 3𝑢3 + 𝑦 9𝑢2𝑣2 − 𝑥𝑦 . ♢ Derivadas de segundo orden con cambios de variables Se dice que 𝑓 (𝑥,𝑦) es una función dos veces diferenciable si es diferenciable y si sus derivadas parciales 𝑓𝑥 (𝑥,𝑦), 𝑓𝑦 (𝑥,𝑦) también son funciones diferenciables, y se puede calcular sus derivadas parciales de segundo orden: 𝑓𝑥𝑥 , 𝑓𝑥𝑦, 𝑓𝑦𝑦. Ahora bien, en presencia de un cambio de variable: { 𝑥 = 𝑥 (𝑢, 𝑣) 𝑦 = 𝑦 (𝑢, 𝑣) } (2.14′) se requiere encontrar las otras derivadas de segundo orden: 𝑓𝑢𝑢 , 𝑓𝑢𝑣 , 𝑓𝑣𝑣 . Resulta que las relaciones que conectan los dos tipos de derivadas de segundo orden no necesitan una nueva variante de la regla de la cadena. Basta usar la regla ya obtenida para las derivadas de primer orden:{ 𝑓𝑢 = 𝑓𝑥 𝑥𝑢 + 𝑓𝑦 𝑦𝑢 𝑓𝑣 = 𝑓𝑥 𝑥𝑣 + 𝑓𝑦 𝑦𝑣 } (2.16a′) reemplazando sistemáticamente la letra 𝑓 por 𝑓𝑥 o por 𝑓𝑦, respectivamente. 12En este ejemplo, para abreviar la discusión, se emplean técnicas matriciales para resolver sistemas lineales de ecuaciones. Otra alternativa es resolverlas “a pie” con manipulaciones algebraicas ordinarias. 2-20 MA–1003: Cálculo III 2.4. Derivación implícita Ejemplo 2.16. Si 𝑧 = 𝑓 (𝑥,𝑦) es dos veces diferenciable, y si 𝑥 = 𝑢2 + 𝑣2, 𝑦 = 𝑢/𝑣 , hallar la segunda derivada parcial mixta 𝑓𝑢𝑣 en términos de las derivadas parciales de 𝑓 con respecto a las variables 𝑥,𝑦. Para este cambio de variable, la regla de la cadena asume la forma concreta13{ 𝑓𝑢 = 𝑓𝑥 (2𝑢) + 𝑓𝑦 (𝑣−1) 𝑓𝑣 = 𝑓𝑥 (2𝑣) + 𝑓𝑦 (−𝑢𝑣−2) } . La derivada de la primera de éstas con respecto a 𝑣 sigue por la regla del producto: 𝑓𝑢𝑣 = 𝜕 𝜕𝑣 ( 2𝑢𝑓𝑥 + 𝑣−1𝑓𝑦 ) = 2𝑢 (𝑓𝑥 )𝑣 − 𝑣−2𝑓𝑦 + 𝑣−1(𝑓𝑦)𝑣 . Las expresiones (𝑓𝑥 )𝑣 y (𝑓𝑦)𝑣 mezclan índices de derivadas nuevas y originales; se debe simplificarlas por estas sustituciones 𝑓 ↦→ 𝑓𝑥 , 𝑓 ↦→ 𝑓𝑦: 𝑓 𝑣 = 2𝑣 𝑓 𝑥 − 𝑢𝑣−2𝑓 𝑦 ↦−→ { (𝑓𝑥 )𝑣 = 2𝑣 𝑓𝑥𝑥 − 𝑢𝑣−2𝑓𝑥𝑦 (𝑓𝑦)𝑣 = 2𝑣 𝑓𝑦𝑥 − 𝑢𝑣−2𝑓𝑦𝑦 } Al enchufar las expresiones al lado derecho en la fórmula provisional para 𝑓𝑢𝑣 , se obtiene 𝑓𝑢𝑣 = 2𝑢 (2𝑣 𝑓𝑥𝑥 − 𝑢𝑣−2𝑓𝑥𝑦) − 𝑣−2𝑓𝑦 + 𝑣−1(2𝑣 𝑓𝑦𝑥 − 𝑢𝑣−2𝑓𝑦𝑦) Esto se puede simplificar, tomando en cuenta que 𝑓𝑦𝑥 = 𝑓𝑥𝑦, para obtener la expresión final: 𝑓𝑢𝑣 = 4𝑢𝑣 𝑓𝑥𝑥 + (2 − 2𝑢2𝑣−2) 𝑓𝑥𝑦 − 𝑢𝑣−3𝑓𝑦𝑦 − 𝑣−2𝑓𝑦 . Es posible chequear este cálculo, aprovechando que 𝑓𝑢𝑣 = 𝑓𝑣𝑢 ≡ 𝜕𝑓𝑣/𝜕𝑢: 𝑓𝑢𝑣 = 𝜕 𝜕𝑢 ( 2𝑣 𝑓𝑥 − 𝑢𝑣−2𝑓𝑦 ) = 2𝑣 (𝑓𝑥 )𝑢 − 𝑣−2𝑓𝑦 − 𝑢𝑣−2(𝑓𝑦)𝑢 y calculando las expresiones (𝑓𝑥 )𝑢 y (𝑓𝑦)𝑢 por las sustituciones 𝑓 𝑢 = 2𝑢𝑓 𝑥 + 𝑣−1𝑓 𝑦 ↦−→ { (𝑓𝑥 )𝑢 = 2𝑢𝑓𝑥𝑥 + 𝑣−1𝑓𝑥𝑦 (𝑓𝑦)𝑢 = 2𝑢𝑓𝑦𝑥 + 𝑣−1𝑓𝑦𝑦 } con lo cual se ve que 𝑓𝑢𝑣 = 2𝑣 (2𝑢𝑓𝑥𝑥 + 𝑣−1𝑓𝑥𝑦) − 𝑣−2𝑓𝑦 − 𝑢𝑣−2(2𝑢𝑓𝑦𝑥 + 𝑣−1𝑓𝑦𝑦) que coincide con la fórmula anterior para 𝑓𝑢𝑣 , como debería. ♢ La presencia del término de primer orden−𝑣−2𝑓𝑦 en el resultado para 𝑓𝑢𝑣 indica que en general un cambio de variable mezcla derivadas parciales de primer y segundo órdenes. Además, los coeficientes 4𝑢𝑣 , etcétera, en el ejemplo son diversas derivadas parciales de las funciones 𝑥 (𝑢, 𝑣) = 𝑢2 + 𝑣2, 𝑦 (𝑢, 𝑣) = 𝑢𝑣−1. 13A la hora de derivar cocientes, tales como 𝑢/𝑣 , es aconsejable emplear exponentes negativos en vez de fracciones. 2-21 MA–1003: Cálculo III 2.4. Derivación implícita No es difícil comprobar, siguiendo el método del Ejemplo 2.16, que las fórmulas generales de cambio para derivadas de segundo orden son: 𝑓𝑢𝑢 = 𝑓𝑥𝑥𝑥 2 𝑢 + 2𝑓𝑥𝑦𝑥𝑢𝑦𝑢 + 𝑓𝑦𝑦𝑦2𝑢 + 𝑓𝑥𝑥𝑢𝑢 + 𝑓𝑦𝑦𝑢𝑢 , 𝑓𝑢𝑣 = 𝑓𝑥𝑥𝑥𝑢𝑥𝑣 + 𝑓𝑥𝑦 (𝑥𝑢𝑦𝑣 + 𝑥𝑣𝑦𝑢) + 𝑓𝑦𝑦𝑦𝑢𝑦𝑣 + 𝑓𝑥𝑥𝑢𝑣 + 𝑓𝑦𝑦𝑢𝑣 , 𝑓𝑣𝑣 = 𝑓𝑥𝑥𝑥 2 𝑣 + 2𝑓𝑥𝑦𝑥𝑣𝑦𝑣 + 𝑓𝑦𝑦𝑦2𝑣 + 𝑓𝑥𝑥𝑣𝑣 + 𝑓𝑦𝑦𝑣𝑣 . No es necesario (ni recomendable) memorizar estas fórmulas. El método de sustitución del Ejemplo anterior es suficiente en todos los casos concretos. Ejemplo 2.17. Si 𝑧 = 𝑓 (𝑥,𝑦) es una función dos veces diferenciable de las variables cartesianas (𝑥,𝑦) ∈ ℝ2, expresar la suma 𝑓𝑥𝑥 + 𝑓𝑦𝑦 en coordenadas polares (𝑟, \ ). La regla de la cadena (2.16a) para las derivadas parciales de primer orden dice que: 𝑓𝑟 = 𝑓𝑥 𝑥𝑟 + 𝑓𝑦 𝑦𝑟 = 𝑓𝑥 cos\ + 𝑓𝑦 sen\, 𝑓\ = 𝑓𝑥 𝑥\ + 𝑓𝑦 𝑦\ = −𝑓𝑥𝑟 sen\ + 𝑓𝑦𝑟 cos\ . Las derivadas parciales “puros” de segundo orden son, entonces: 𝑓𝑟𝑟 = (𝑓𝑥 )𝑟 cos\ + (𝑓𝑦)𝑟 sen\ = (𝑓𝑥𝑥 cos\ + 𝑓𝑥𝑦 sen\ ) cos\ + (𝑓𝑦𝑥 cos\ + 𝑓𝑦𝑦 sen\ ) sen\ = 𝑓𝑥𝑥 cos2 \ + 2𝑓𝑥𝑦 sen\ cos\ + 𝑓𝑦𝑦 sen2 \, 𝑓\\ = −(𝑓𝑥 )\ 𝑟 sen\ − 𝑓𝑥𝑟 cos\ + (𝑓𝑦)\ 𝑟 cos\ − 𝑓𝑦𝑟 sen\ = − ( −𝑓𝑥𝑥 𝑟 sen\ + 𝑓𝑥𝑦 𝑟 cos\ ) 𝑟 sen\ + ( −𝑓𝑦𝑥 𝑟 sen\ + 𝑓𝑦𝑦 𝑟 cos\ ) 𝑟 cos\ − 𝑟 (𝑓𝑥 cos\ + 𝑓𝑦 sen\ ) = 𝑟2𝑓𝑥𝑥 sen2 \ − 2𝑟2𝑓𝑥𝑦 sen\ cos\ + 𝑟2𝑓𝑦𝑦 cos2 \ − 𝑟 𝑓𝑟 Al sumar la primera con 𝑟−2 veces la segunda, se obtiene una combinación elegante: 𝑓𝑟𝑟 + 𝑟−2𝑓\\ = 𝑓𝑥𝑥 + 𝑓𝑦𝑦 − 𝑟−1𝑓𝑟 y el resultado sigue, al sumar 𝑟−1𝑓𝑟 a las dos lados: 𝑓𝑥𝑥 + 𝑓𝑦𝑦 = 𝑓𝑟𝑟 + 1 𝑟 𝑓𝑟 + 1 𝑟2 𝑓\\ . ♢ El resultado del Ejercicio 2.17 se escribe de esta manera, en notación alemana: 𝜕2𝑓 𝜕𝑥2 + 𝜕 2𝑓 𝜕𝑦2 = 𝜕2𝑓 𝜕𝑟2 + 1 𝑟 𝜕𝑓 𝜕𝑟 + 1 𝑟2 𝜕2𝑓 𝜕\2 . (2.22) 2-22 MA–1003: Cálculo III 2.5. La fórmula de Taylor en varias variables 2.5. La fórmula de Taylor en varias variables Una función de una variable 𝑡 ↦→ 𝑔(𝑡) se llama suave si posee derivadas de cualquier orden: 𝑔′(𝑡), 𝑔′′(𝑡), 𝑔′′′(𝑡), etcétera. Se dice que una función de dos variables 𝑓 (𝑥,𝑦) también es suave si posee derivadas parciales (continuas) de cualquier orden. La fórmula de Taylor (definida más abajo), una vez declarado un punto de referencia (𝑥0, 𝑦0), expresa la función suave 𝑓 (𝑥,𝑦) en términos de los valores de 𝑓 y de sus derivadas parciales en el punto (𝑥0, 𝑦0). Para los efectos de los cálculos que siguen, conviene escribir 𝑥 = 𝑥0 + ℎ, 𝑦 = 𝑦0 + 𝑘 empleando los incrementos ℎ, 𝑘 como las variables preferidas en vez de 𝑥,𝑦. Por ejemplo, el plano tangente (2.7) a la superficie 𝑧 = 𝑓 (𝑥,𝑦) en el punto (𝑥0, 𝑦0, 𝑧0), antes escrito en la forma 𝑧 − 𝑧0 =𝑚1(𝑥 − 𝑥0) +𝑚2(𝑦 − 𝑦0), se puede abreviar como 𝑧 = 𝑧0 +𝑚1ℎ +𝑚2𝑘, donde𝑚1 = 𝑓𝑥 (𝑥0, 𝑦0),𝑚2 = 𝑓𝑦 (𝑥0, 𝑦0), como antes. O bien, con más detalle: 𝑧 = 𝑓 (𝑥0, 𝑦0) + ℎ 𝑓𝑥 (𝑥0, 𝑦0) + 𝑘 𝑓𝑦 (𝑥0, 𝑦0) . En esta ecuación de un plano, el lado derecho es de primer grado en las variables ℎ, 𝑘. De acuerdo con la discusión en el apartado 2.2, este es el plano que mejor aproxima la función 𝑧 = 𝑓 (𝑥,𝑦) cerca del punto (𝑥0, 𝑦0). Explícitamente, 𝑓 (𝑥0 + ℎ,𝑦0 + 𝑘) = 𝑓 (𝑥0, 𝑦0) + ℎ 𝑓𝑥 (𝑥0, 𝑦0) + 𝑘 𝑓𝑦 (𝑥0, 𝑦0) + 𝑅1𝑓 (ℎ, 𝑘), (2.23) donde el resto 𝑅1𝑓 (ℎ, 𝑘) es pequeño en comparación con la distancia √ ℎ2 + 𝑘2 entre los puntos (𝑥0, 𝑦0) y (𝑥0 + ℎ,𝑦0 + 𝑘). ⟦En detalle: ĺım(ℎ,𝑘)→(0,0) 𝑅1𝑓 (ℎ, 𝑘)/ √ ℎ2 + 𝑘2 = 0.⟧ ▶ Esta fórmula (2.23) expresa el teorema de Taylor hasta primer orden de derivadas. Para mejorar la aproximación, es necesario agregar un término de segundo orden, de la forma 𝑎ℎ2+2𝑏ℎ𝑘 +𝑐𝑘2, cuyos coeficientes 𝑎, 𝑏, 𝑐 dependen de las derivadas parciales de 𝑓 de segundo orden. Para obtener estas coeficientes, se introduce un artificio que convierte el problema en un asunto de una variable. La recta que pasa por los puntos (𝑥0, 𝑦0) y (𝑥0 + ℎ,𝑦0 + 𝑘) se parametriza por una variable 𝑡 ∈ ℝ, de modo que sus puntos se nombran (𝑥0+𝑡ℎ,𝑦0+𝑡𝑘) – véase la Figura 2.4. 2-23 MA–1003: Cálculo III 2.5. La fórmula de Taylor en varias variables (𝑥0, 𝑦0) 𝑡=0 (𝑥0 + 𝑡ℎ,𝑦0 + 𝑡𝑘) 𝑡 (𝑥0 + ℎ,𝑦0 + 𝑘) 𝑡=1 Figura 2.4: Una recta en el plano ℝ2 Los valores de 𝑓 (𝑥,𝑦) en los puntos de la recta definen una función de 𝑡 , así: 𝑔(𝑡) := 𝑓 (𝑥0 + 𝑡ℎ,𝑦0 + 𝑡𝑘), para 𝑡 ∈ ℝ. El teorema de Taylor – en una sola variable – es aplicable a esta función, cerca de 𝑡 = 0: 𝑔(𝑡) = 𝑔(0) + 𝑔′(0) 𝑡 + 1 2 𝑔 ′′(0) 𝑡2 + 𝑅2𝑔(𝑡), (2.24) donde el resto 𝑅2𝑔(𝑡) obedece ĺım𝑡→0 𝑅2𝑔(𝑡)/𝑡2 = 0. (Evidentemente, es posible seguir hasta tercer orden u órdenes superiores.) Las derivadas de 𝑔(𝑡) se calculan mediante la regla de la cadena. Si 𝑥 (𝑡) := 𝑥0 + 𝑡ℎ, 𝑦 (𝑡) := 𝑦0 + 𝑡𝑘, entonces 𝑥′(𝑡) ≡ ℎ, 𝑦′(𝑡) ≡ 𝑘; y 𝑔(𝑡) = 𝑓 (𝑥 (𝑡), 𝑦 (𝑡)), y se sigue que 𝑔′(𝑡) = 𝑓𝑥 (𝑥 (𝑡), 𝑦 (𝑡)) 𝑥′(𝑡) + 𝑓𝑦 (𝑥 (𝑡), 𝑦 (𝑡)) 𝑦′(𝑡) = ℎ 𝑓𝑥 (𝑥 (𝑡), 𝑦 (𝑡)) + 𝑘 𝑓𝑦 (𝑥 (𝑡), 𝑦 (𝑡)) = [ ℎ 𝑓𝑥 + 𝑘 𝑓𝑦 ] (𝑥 (𝑡), 𝑦 (𝑡)) . La derivada de segundo orden usa la regla de la cadena para las funciones 𝑓𝑥 , 𝑓𝑦, respectivamente: 𝑔′′(𝑡) = ℎ [ 𝑓𝑥𝑥 (𝑥 (𝑡), 𝑦 (𝑡)) 𝑥′(𝑡) + 𝑓𝑥𝑦 (𝑥 (𝑡), 𝑦 (𝑡)) 𝑦′(𝑡) ] + 𝑘 [ 𝑓𝑦𝑥 (𝑥 (𝑡), 𝑦 (𝑡)) 𝑥′(𝑡) + 𝑓𝑦𝑦 (𝑥 (𝑡), 𝑦 (𝑡)) 𝑦′(𝑡) ] = ℎ2 𝑓𝑥𝑥 (𝑥 (𝑡), 𝑦 (𝑡)) + 2ℎ𝑘 𝑓𝑥𝑦 (𝑥 (𝑡), 𝑦 (𝑡)) + 𝑘2 𝑓𝑦𝑦 (𝑥 (𝑡), 𝑦 (𝑡)) = [ ℎ2 𝑓𝑥𝑥 + 2ℎ𝑘 𝑓𝑥𝑦 + 𝑘2 𝑓𝑦𝑦 ] (𝑥 (𝑡), 𝑦 (𝑡)). Al evaluar estas expresiones en 𝑡 = 0, se obtiene el teorema de Taylor de segundo orden para 𝑓 en (𝑥0, 𝑦0): 𝑓 (𝑥0 + ℎ,𝑦0 + 𝑘) (2.25) = 𝑓 (𝑥0, 𝑦0) + [ ℎ 𝑓𝑥 + 𝑘 𝑓𝑦 ] (𝑥0, 𝑦0) + 1 2 [ ℎ2 𝑓𝑥𝑥 + 2ℎ𝑘 𝑓𝑥𝑦 + 𝑘2 𝑓𝑦𝑦 ] (𝑥0, 𝑦0) + 𝑅2𝑓 (ℎ, 𝑘), donde el resto 𝑅2𝑓 (ℎ, 𝑘) es pequeño en comparación con (ℎ2 + 𝑘2); en otras palabras: ĺım(ℎ,𝑘)→(0,0) 𝑅2𝑓 (ℎ, 𝑘)/(ℎ2 + 𝑘2) = 0. 2-24 MA–1003: Cálculo III 2.5. La fórmula de Taylor en varias variables ▶ Dejando de lado la estimación del resto 𝑅2𝑓 , es oportuno enfocar el cálculo de los términos de segundo orden. Estos se pueden escribir en una notación matricial, así:[ ℎ 𝑘 ] [ 𝑓𝑥𝑥 𝑓𝑥𝑦 𝑓𝑥𝑦 𝑓𝑦𝑦 ] [ ℎ 𝑘 ] = ℎ2 𝑓𝑥𝑥 + 2ℎ𝑘 𝑓𝑥𝑦 + 𝑘2 𝑓𝑦𝑦 . Esta matriz merece una notación y un nombre especiales:1⁴ 𝐻 𝑓 (𝑥,𝑦) := [ 𝑓𝑥𝑥 𝑓𝑥𝑦 𝑓𝑥𝑦 𝑓𝑦𝑦 ] (2.26) es la matriz hessiana de la función 𝑓 . Nótese bien que ésta es una matriz simétrica, en virtud de la igualdad 𝑓𝑥𝑦 = 𝑓𝑦𝑥 . Ejemplo 2.18. Obtener el desarrollo de Taylor hasta segundo orden de la función 𝑓 (𝑥,𝑦) := 𝑒2𝑥+3𝑦, alrededor del origen (𝑥0, 𝑦0) = (0, 0). La fórmula de Taylor de 𝑓 en el origen, según (2.25), es 𝑓 (ℎ, 𝑘) = 𝑓 (0, 0) + [ ℎ 𝑓𝑥 + 𝑘 𝑓𝑦 ] (0, 0) + 1 2 [ ℎ2 𝑓𝑥𝑥 + 2ℎ𝑘 𝑓𝑥𝑦 + 𝑘2 𝑓𝑦𝑦 ] (0, 0) + 𝑅2𝑓 (ℎ, 𝑘). Es claro que 𝑓 (0, 0) = 𝑒0 = 1. Las derivadas parciales de 𝑓 , hasta segundo orden, son: 𝑓𝑥 = 2 𝑒2𝑥+3𝑦, 𝑓𝑦 = 3 𝑒2𝑥+3𝑦, 𝑓𝑥𝑥 = 4 𝑒2𝑥+3𝑦, 𝑓𝑥𝑦 = 6 𝑒2𝑥+3𝑦, 𝑓𝑦𝑦 = 9 𝑒2𝑥+3𝑦 . Al evaluarlas en (0, 0), se obtiene: 𝑓𝑥 ↦→𝑚1 = 2, 𝑓𝑦 ↦→𝑚2 = 3; 𝑓𝑥𝑥 ↦→ 4, 𝑓𝑥𝑦 ↦→ 6, 𝑓𝑦𝑦 ↦→ 9. Entonces 𝑒2ℎ+3𝑘 = 1 + (2ℎ + 3𝑘) + 1 2 (4ℎ 2 + 12ℎ𝑘 + 9𝑘2) + 𝑅2𝑓 (ℎ, 𝑘) . Si se quiere usar las variables usuales (𝑥,𝑦) en vez de (ℎ, 𝑘), esto se escribe así: 𝑒2𝑥+3𝑦 = 1 + 2𝑥 + 3𝑦 + 2𝑥2 + 6𝑥𝑦 + 9 2𝑦 2 + 𝑅2𝑓 (𝑥,𝑦). ♢ Si se quiere seguir el desarrollo de Taylor hasta tercer orden, es cuestión de ampliar la expansión (2.24): 𝑔(𝑡) = 𝑔(0) + 𝑔′(0) 𝑡 + 1 2 𝑔 ′′(0) 𝑡2 + 1 6 𝑔 ′′′(0) 𝑡3 + 𝑅3𝑔(𝑡), y convertir la tercera derivada 𝑔′′′(𝑡) con la regla de la cadena, como antes. Resulta: 𝑔′′′(𝑡) = [ ℎ3 𝑓𝑥𝑥𝑥 + 3ℎ2𝑘 𝑓𝑥𝑥𝑦 + 3ℎ𝑘2 𝑓𝑥𝑦𝑦 + 𝑘3 𝑓𝑦𝑦𝑦 ] (𝑥 (𝑡), 𝑦 (𝑡)) . 14El matemático alemán Otto Hesse (1811–1874) lo empleó en sus trabajos a partir de 1844. 2-25 MA–1003: Cálculo III 2.5. La fórmula de Taylor en varias variables La expansión (2.25) se modifica de esta manera: 𝑅2𝑓 (ℎ, 𝑘) ↦−→ +1 6 [ ℎ3 𝑓𝑥𝑥𝑥 + 3ℎ2𝑘 𝑓𝑥𝑥𝑦 + 3ℎ𝑘2 𝑓𝑥𝑦𝑦 + 𝑘3 𝑓𝑦𝑦𝑦 ] (𝑥0, 𝑦0) + 𝑅3𝑓 (ℎ, 𝑘) . (Los coeficientes para las derivadas parciales superiores de 𝑓 se toman del triángulo de Pascal.) ▶ Para funciones de tres variables, el teorema de Taylor funciona de igual manera. Hasta primer orden, se puede escribir: 𝑓 (𝑥0 + ℎ,𝑦0 + 𝑘, 𝑧0 + 𝑙) = 𝑓 (𝑥0, 𝑦0, 𝑧0) + ℎ 𝑓𝑥 (𝑥0, 𝑦0, 𝑧0) + 𝑘 𝑓𝑦 (𝑥0, 𝑦0, 𝑧0) + 𝑙 𝑓𝑧 (𝑥0, 𝑦0, 𝑧0) + 𝑅1𝑓 (ℎ, 𝑘, 𝑙) = 𝑓 (𝑥0, 𝑦0, 𝑧0) + [ ℎ 𝑓𝑥 + 𝑘 𝑓𝑦 + 𝑙 𝑓𝑧 ] (𝑥0, 𝑦0, 𝑧0) + 𝑅1𝑓 (ℎ, 𝑘, 𝑙). La fórmula de Taylor, hasta segundo orden, es la que sigue: 𝑓 (𝑥0 + ℎ,𝑦0 + 𝑘, 𝑧0 + 𝑙) = 𝑓 (𝑥0, 𝑦0, 𝑧0) + [ ℎ 𝑓𝑥 + 𝑘 𝑓𝑦 + 𝑙 𝑓𝑧 ] (𝑥0, 𝑦0, 𝑧0) + 1 2 [ ℎ2 𝑓𝑥𝑥 + 2ℎ𝑘 𝑓𝑥𝑦 + 2ℎ𝑙 𝑓𝑥𝑧 + 𝑘2 𝑓𝑦𝑦 + 2𝑘𝑙 𝑓𝑦𝑧 + 𝑙2 𝑓𝑧𝑧 ] (𝑥0, 𝑦0, 𝑧0) + 𝑅2𝑓 (ℎ, 𝑘, 𝑙). El hessiano 𝐻 𝑓 (𝑥,𝑦, 𝑧) es la matriz 3 × 3 que aparece en la expresión:[ ℎ 𝑘 𝑙 ]  𝑓𝑥𝑥 𝑓𝑥𝑦 𝑓𝑥𝑧 𝑓𝑥𝑦 𝑓𝑦𝑦 𝑓𝑦𝑧 𝑓𝑥𝑧 𝑓𝑦𝑧 𝑓𝑧𝑧   ℎ 𝑘 𝑙  = ℎ2 𝑓𝑥𝑥 + 2ℎ𝑘 𝑓𝑥𝑦 + 2ℎ𝑙 𝑓𝑥𝑧 + 𝑘2 𝑓𝑦𝑦 + 2𝑘𝑙 𝑓𝑦𝑧 + 𝑙2 𝑓𝑧𝑧 . Ejemplo 2.19. Obtener el desarrollo de Taylor hasta segundo orden, en el punto ( 𝜋2 , 𝜋 2 , 𝜋 2 ), de la función 𝑓 (𝑥,𝑦, 𝑧) := sen𝑥 + sen𝑦 + sen 𝑧 − sen(𝑥 + 𝑦 + 𝑧). Nótese, en primer lugar, que 𝑓 ( 𝜋2 , 𝜋 2 , 𝜋 2 ) = 1 + 1 + 1 − (−1) = 4, usando la identidad conocida sen( 3𝜋2 ) =