Para comprender el concepto detrás del aprendizaje automático, así como el aprendizaje profundo, los principios del álgebra lineal son cruciales. El álgebra lineal es una rama de las matemáticas que permite definir y realizar operaciones sobre coordenadas de dimensiones superiores e interacciones planas de forma concisa. Su enfoque principal está en los sistemas de ecuaciones lineales.
En este artículo, discutiremos sobre:
- ¿Idea detrás del vector base?
- Definición de vector base
- Propiedades del vector base
- Vectores base para un espacio dado
- Es importante desde el punto de vista de la ciencia de datos.
¿Cuál es la idea detrás de los vectores base?
Entonces, la idea aquí es la siguiente,
Tomemos un espacio R-cuadrado que básicamente significa que estamos viendo vectores en 2 dimensiones. Significa que hay 2 componentes en cada uno de estos vectores como hemos tomado en la imagen de arriba. Podemos tomar muchos muchos vectores. Entonces, habrá un número infinito de vectores, que estarán en 2 dimensiones. Entonces, el punto es si podemos representar todos estos vectores usando algunos elementos básicos y luego alguna combinación de estos elementos básicos.
Ahora, consideremos 2 vectores por ejemplo,
Ahora, si toma cualquier vector dado en el espacio R cuadrado, digamos que tome
Podemos escribir este vector como una combinación lineal de este vector más este vector de la siguiente manera.
Del mismo modo, si toma
También podemos escribir este vector como una combinación lineal de este vector más este vector de la siguiente manera.
Similarmente,
Y eso sería cierto para cualquier vector que tengas en este espacio.
Entonces, en cierto sentido, lo que decimos es que estos 2 vectores ( v1 y v2 ) caracterizan el espacio o forman una base para el espacio y cualquier vector en este espacio puede escribirse simplemente como una combinación lineal de estos 2 vectores. Ahora puedes notar que las combinaciones lineales son en realidad los números mismos. Entonces, por ejemplo, si quiero que el vector (2, 1) se escriba como una combinación lineal del vector (1, 0) y el vector (0, 1) , los múltiplos escalares son 2 y 1 , que es similar para el vector ( 4, 4) y así sucesivamente.
Entonces, el punto clave es que si bien tenemos una cantidad infinita de vectores aquí, todos pueden generarse como una combinación lineal de solo 2 vectores y hemos visto aquí que estos 2 vectores son vector (1, 0) y vector (0, 1) . Ahora, estos 2 vectores se llaman la base de todo el espacio.
Definición de vector base: si puede escribir cada vector en un espacio dado como una combinación lineal de algunos vectores y estos vectores son independientes entre sí, entonces los llamamos vectores base para ese espacio dado.
Propiedades del vector base:
- Los vectores base deben ser linealmente independientes entre sí:
si multiplico v1 por cualquier escalar, nunca podré obtener el vector v2. Y eso prueba que v1 y v2 son linealmente independientes entre sí. Queremos que los vectores base sean linealmente independientes entre sí porque queremos que cada vector, es decir, sobre la base, genere información única. Si se vuelven dependientes unos de otros, entonces este vector no traerá nada único.
- Los vectores base deben abarcar todo el espacio:
la palabra abarcar básicamente significa que cualquier vector en ese espacio, lo puedo escribir como una combinación lineal de los vectores base como vemos en nuestro ejemplo anterior. - Los vectores base no son únicos: se pueden encontrar muchos conjuntos de vectores base. Las únicas condiciones son que deben ser linealmente independientes y deben abarcar todo el espacio. Entonces, comprendamos esta propiedad en detalle tomando el mismo ejemplo que hemos tomado antes.
Consideremos otros 2 vectores, que son linealmente independientes entre sí.
- Primero tenemos que verificar si estos 2 vectores obedecen las propiedades del vector base.
Puede ver que estos 2 vectores son linealmente independientes entre sí, ya que multiplicar v1 por cualquier escalar nunca puede obtener el vector v2. Entonces, por ejemplo, si multiplico v1 por -1 obtendré vector(-1, -1) , pero no vector(1, -1) .Para verificar la segunda propiedad, tomemos el vector(2, 1) . Ahora, veamos si podemos representar este vector(2, 1) como una combinación lineal del vector(1, 1) y el vector(1, -1) .
- Entonces, si observa esto, hemos representado con éxito este vector (2, 1) como una combinación lineal del vector (1, 1) y el vector (1, -1) . Puedes notar que en el caso anterior cuando usamos vector(1, 0) y vector(0, 1) , dijimos que esto se puede escribir como 2 veces de vector(1, 0) y 1 vez de vector(0, 1) ; sin embargo, los números han cambiado ahora. No obstante, puedo escribir esto como una combinación lineal de estos 2 vectores base.
De manera similar, si tomas el vector (1,3)
- De manera similar, si tomas el vector (4,4)
- Entonces, esta es otra combinación lineal de los mismos vectores base. Entonces, el punto clave que quiero resaltar aquí es que los vectores base no son únicos. Hay muchas formas de definir los vectores base; sin embargo, todos comparten la misma propiedad de que, si tengo un conjunto de vectores que llamo vector base, esos vectores deben ser independientes entre sí y deben abarcar todo el espacio.
Por lo tanto, este v1 y v2 también son vectores base para R 2 .
Punto a recordar:
Una cosa interesante a tener en cuenta aquí es que no podemos tener 2 conjuntos básicos que tengan un número diferente de vectores. Lo que quiero decir aquí es que en el ejemplo anterior, aunque los vectores base eran v1 (1, 0) y v2 (0, 1) , solo había 2 vectores. De manera similar, en este caso, los vectores base son v1(1, 1) y v2(1, -1). Sin embargo, todavía hay solo 2 vectores. Entonces, si bien podría tener muchos conjuntos de vectores base, todos ellos equivalentes a la cantidad de vectores en cada conjunto serán iguales, no pueden ser diferentes. Entonces algo que debes tener en cuenta que para el mismo espacio no puedes tener 2 conjuntos de bases uno con n vectores y otro con m vectores eso no es posible. Entonces, si es un conjunto básico para el mismo espacio, la cantidad de vectores en cada conjunto debe ser la misma.
Encuentra vectores base:
Tomemos un ejemplo del espacio R 4 . Lo que realmente significa que hay 4 componentes en cada uno de estos vectores.
- Paso 1: Para encontrar los vectores base del conjunto de vectores dado, organice los vectores en forma de array como se muestra a continuación.
- Paso 2: Encuentra el rango de esta array.
Si identifica el rango de esta array, le dará el número de columnas linealmente independientes . El rango de la array nos dirá cuántas son fundamentales para explicar todas estas columnas y cuántas columnas necesitamos. Entonces, podemos generar las columnas restantes como una combinación lineal de estas columnas.Para conocer el rango de la array, consulte este enlace. Entonces, para esto, el rango de la array es 2.
- Paso 3:
Cualquiera de las dos columnas independientes se pueden seleccionar de la array anterior como vectores base.
Explicación:
si el rango de la array es 1, entonces tenemos solo 1 vector base, si el rango es 2, entonces hay 2 vectores base, si es 3, entonces hay 3 vectores base y así sucesivamente. En este caso, dado que el rango de la array resulta ser 2, solo hay 2 vectores de columna que necesito para representar cada columna en esta array. Entonces, el conjunto base tiene tamaño 2. Entonces, podemos elegir 2 columnas linealmente independientes aquí y luego esas podrían ser los vectores base.
Entonces, por ejemplo, podríamos elegir v1(6, 5, 8, 11) y v2(1, 2, 3, 4) y decir, este es el vector base para todas estas columnas o podríamos elegir v1(3, -1, -1, -1) y v2 (7, 7, 11, 15) y así sucesivamente. Podemos elegir 2 columnas cualquiera siempre que sean linealmente independientes entre sí y esto es algo que sabemos desde arriba que los vectores base no necesitan ser únicos. Entonces, elijo 2 columnas linealmente independientes que representan estos datos.
Importante desde el punto de vista de la ciencia de datos
Ahora, déjame explicarte por qué este concepto de vectores base es muy, muy importante desde el punto de vista de la ciencia de datos. Basta con echar un vistazo al ejemplo anterior. Tenemos 10 muestras y queremos almacenar estas 10 muestras ya que cada muestra tiene 4 números, estaríamos almacenando 4 x 10 = 40 números.
Ahora, supongamos que hacemos el mismo ejercicio, para estas 10 muestras y luego encontramos que solo tenemos 2 vectores base, que serán 2 vectores fuera de este conjunto. Lo que podríamos hacer es almacenar estos 2 vectores base que serían 2 x 4 = 8 números y para las 8 muestras restantes, en lugar de almacenar todas las muestras y todos los números en cada una de estas muestras, lo que podríamos hacer es que para cada muestra podríamos simplemente almacenar 2 números, que son las combinaciones lineales que vamos a usar para construir esto. Entonces, en lugar de almacenar estos 4 números, podríamos simplemente almacenar esas 2 constantes y dado que ya hemos almacenado los vectores base, cada vez que queramos reconstruir esto, podemos simplemente tomar la primera constante y multiplicarla por v1 más la segunda constante multiplicar por v2 y obtendremos este número.
Entonces, en resumen,
Almacenamos 2 vectores base que me dan: 4 x 2 = 8 números
Y luego, para las 8 muestras restantes, simplemente almacenamos 2 constantes, por ejemplo: 8 x 2 = 16 números
Entonces, esto nos daría: 8 + 16 = 24 números
Por lo tanto en lugar de almacenar 4 x 10 = 40 números, podemos almacenar solo 24 números, que es aproximadamente la mitad de la reducción del número. Y podremos reconstruir todo el conjunto de datos almacenando solo 24 números.
Entonces, por ejemplo, si tiene un vector de 30 dimensiones y los vectores base son solo 3, entonces puede ver el tipo de reducción que obtendrá en términos de almacenamiento de datos. Entonces, este es un punto de vista de la ciencia de datos.
¿Por qué la reducción en el almacenamiento de datos se beneficiará desde el punto de vista de la ciencia de datos?
Es muy importante comprender y caracterizar los datos en términos de lo que caracteriza fundamentalmente a los datos. Entonces, para que pueda almacenar menos, podemos hacer cálculos más inteligentes y hay muchas otras razones por las que querremos hacer esto,
- Puede identificar esta base para identificar un modelo entre estos datos.
- Puede identificar una base para realizar la reducción de ruido en los datos.
Publicación traducida automáticamente
Artículo escrito por AmiyaRanjanRout y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA