
Técnica Single Node Processing: ¡procesa datos sin complicaciones!

Description of Técnica Single Node Processing: ¡procesa datos sin complicaciones!
¡Prepárate para un debate apasionante sobre el procesamiento de datos! En el nuevo episodio de Cómo conocí a nuestro cloud, nos sumergimos en el mundo del Single Node Processing, una técnica que desafía la omnipresencia de la computación distribuida. ¿Es una reliquia del pasado o una solución sorprendentemente vigente en la era del Big Data?
This content is generated from the locution of the audio so it may contain errors.
Vivimos en un mundo donde la alta disponibilidad, el disaster recovery y la escalabilidad son conceptos más que asimilados, pero hay un término que ciertamente está tomando fuerza, el procesamiento en un solo nodo, o single node processing, que en inglés suena siempre mejor.
¿No es esto una reliquia del pasado? ¿Es una simple curiosidad en la era de la computación distribuida? ¿Sigue siendo una herramienta esencial en nuestro arsenal tecnológico? Hoy hablaremos del procesamiento en un único nodo, ventajas, limitaciones y su papel en el análisis de datos hoy en día.
Para hablar de esta tendencia hemos traído a Andrés Navidad, muy habitual del programa y un enamorado de las técnicas de analítica distribuida. Hola Navi.
Hola, muy buenas Tomás, ¿qué tal? Muy bien. A mi lado, como siempre, está el gran Oscar Ferrer. Hola Oscar.
Hola, muy buenas.
Yo soy Tomás Calleja, esto es Cómo conocer nuestro cloud, dentro intro y empezamos.
Estás escuchando Cómo conocer nuestro cloud, un podcast en el que hablaremos sobre Google Cloud y cómo sacarle el máximo partido a los servicios que ofrece de una manera imparcial y amena.
Bueno Navi, pues un placer tenerte aquí como siempre. Hoy vamos a hablar de procesamiento, ¿vale? Y vamos a hablar, esto me recuerda un poco a la guerra monolito versus microservicios, ¿no? De cuándo un monolito sí, cuándo un microservicio sí y cuándo no.
Pues yo creo que nos llevamos esto al mundo del procesamiento de datos, ¿no? Y hoy vamos a hablar de single node processing, que es cuándo tiene sentido procesar con un único nodo o cuándo no y demás.
Lo podríamos decir también como cuándo no hay que fliparse.
Oye, y es que también, bueno, es que me voy a meter ya a debatir, ¿no? Pero también pasa una cosa y es que parece que cuando estás arrancando algo y estás en una empresa, tienes que ir siempre como al libro, ¿no? Al libro de PTT, a hacerlo todo bien estandarizado y no sé qué.
Y lo que se lleva, tampoco nos engañemos, pues es el procesamiento distribuido.
Hemos tenido problemas de escalabilidad y pues inventó el procesamiento de distribuir datos y ahí está.
Pero claro, ahora la pregunta que intentaremos resolver es, ¿tiene sentido eso hacerlo siempre así o no? Sí.
Sí.
Hay una cosa que es verdad. Mira, me gustaría empezar un poco, no filosofando, pero sí que es verdad con una frase que con lo que ha comentado Tomás con el tema de monolito y microservicios, por ejemplo, en su momento y demás, que muchas veces cuando estamos empezando un proyecto o queremos hacer algo, buscamos la perfección, ¿no? Y a veces la perfección nos impide avanzar todo lo rápido que podamos, ¿no? Entonces, es verdad que a nivel de computación, cuando hablamos de la era de los datos, de que la cantidad de información que se genera es brutal, parece que ya tenemos que empezar con ese tipo de tecnologías, ¿no? Y a mí siempre me gusta cuando yo vengo de hace tiempo, ¿no? Cuando por 2013 aquí en España empezó a abarcarse un poco el tema del Big Data, que ya sí que empezó un poco más fuerte, había una slide que me encantaba, ¿no? Que era la slide del miedo, ¿vale? Era una slide que era obligatorio poner en cada presentación que hacías y eran dos ejes, ¿vale? El eje horizontal, ¿vale? Del tiempo y el eje vertical de datos, del número de datos y cómo crece exponencialmente, ¿no? Entonces, se vendió como que el tema del Big Data y la computación distribuida y las fringas de procesamiento distribuida era necesario porque tus datos iban a crecer siempre exponencialmente, ¿vale? Entonces, era como que viene el Big Data, tienes que comprar lo que estoy vendiendo, ¿vale? Eso era como algo así.
Era un boom, igual que ahora está pasando en parte, ¿no? Hay ciertas tendencias, que sé que es verdad que tecnológicamente es un avance, pero hay ciertas tendencias que se imponen, ¿no? Pero lo que ha pasado realmente es que sí que llegó eso, pero no llegó para todo el público. Es decir, al final no hemos ido dando cuenta cuando han ido pasando los años que muchos proyectos que llegan, muchos clientes, sí que pueden generar una cierta cantidad de información importante, ¿no? Pero cuando te das cuenta, realmente no tienes que procesar toda esa cantidad de información, sino que al final existe ese concepto, ¿no? De datos fríos, datos calientes y demás.
Y realmente se hacía muy extraño que en el día a día, cuando tienes que procesar, por ejemplo, datos mensuales de un mes acumulado, es raro la vez que tienes que procesar más de un tera de información en un único proceso. Es decir, es raro que pase ese tipo de cosas.
Entonces, con el tiempo se nos ha ido poniendo en nuestro sitio y...
Perdona que te pare, Navi, para quien nos escuche. ¿Un tera de información cuánto es? Uf, pues claro, ahí es buena pregunta, ¿no?