Workshop sobre Bioinformática (gentileza de “El Binario”)

Workshop sobre Bioinformática

 

 

 

 

 

 

 

 

 

Hemos obtenido permiso para poder ir publicando los logs de los talleres que se están ofreciendo estos días en el canal #semananegra del freenode.

— Log opened sáb may 10 21:54:26 2014
22:08 <@MASTER> empecemos con la intro

22:09 ╺┳╸┏━┓╻ ╻ ┏━╸┏━┓ ┏┓ ╻┏━┓╻┏┓╻┏━╸ ╻ ╻┏━┓ ╺┓

22:09 ┃ ┣━┫┃ ┃ ┣╸ ┣┳┛ ┣┻┓┃┃ ┃┃┃┗┫┣╸ ┃┏┛┃┃┃ ┃

22:09 ╹ ╹ ╹┗━╸┗━╸┗━╸╹┗╸ ┗━┛╹┗━┛╹╹ ╹╹ ┗┛ ┗━┛╹╺┻╸

22:09 <@MASTER> ¿Quien sabe lo que es la bioinformática así a grandes rasgos?

22:09 <@PUPILO> ni idea

22:09 <@PUPILO> yo ni idea

22:10 <@MASTER> vale pues voy a ir ayudando con unos apuntes :)
La Bioinformática aborda el estudio, desarrollo y uso de técnicas y herramientas computacionales para el análisis de la información biológica. Estudia el desarrollo de métodos computacionales y técnicas estadísticas para resolver problemas prácticos y teóricos derivados del almacenamiento, extracción, manipulación y distribución de información relativa a macromoléculas biológicas como el ADN, ARN y proteínas
22:11 <@MASTER> es una asignatura multidisciplinar

22:11 <@PUPILO> o/

22:11 <@MASTER> es decir hay que saber de informática biología y química

22:11 <@PUPILO> genial

La bioinformática está fuertemente ligada a la biología molecular.
En el momento en que esta última empezó a producir datos y éstos a almacenarse en soporte digital, se dieron las condiciones para iniciar uno de las simbiosis más productivas en la ciencia moderna.
La informática se alió entonces con la biología para gestionar y procesar los datos que producía.
Las secuencias biológicas fueron el punto de partida.

22:13 <@MASTER> Objetivo de la Bioinformática

22:13 <@MASTER> El objetivo principal de la Bioinformática es lograr entender mejor las células
y la manera en que funcionan a nivel molecular. Esto es realizado mediante el análisis de secuencias
moleculares en bruto y datos estructurales

22:13 <@MASTER> De esta manera la investigación en bioinformática puede generar nuevas ideas y ofrecer
una perspectiva global de las funciones célulares

22:14 <@MASTER> ¿mas o menos?, ¿dudas?

22:14 <@PUPILO> de momento, bien

22:14 <@MASTER> seguimos

El genoma es todo el material genético almacenado en las células de un organismo. La genómica es el estudio integral del origen, evolución y funcionamiento del genoma. Su rama estructural estudia la forma espacial de las moléculas, en especial de proteínas y ADN, y las funciones asociadas a ella.

22:14  <@PUPILO> contempla funcionamiento de redes neuronales?
22:15  <@MASTER> ahora se están comenzando a implementar
22:15  <@MASTER> ten en cuenta q para manejar un volumen de datos tan grande necesitas un datacenter
22:15  <@MASTER> La proteómica es el equivalente de la genómica a nivel de proteínas, es decir relaciona las proteínas con sus genes.
La bioinformática es una disciplina relativamente joven en la que 
continuamente se producen nuevas tecnologías para obtener datos en 
nuevos experimentos, y que requieren el desarrollo de nuevas estrategias
 o algoritmos y su implementación en servidores Web que es la forma 
tradicional en el área de ofrecer los servicios a la comunidad 
científica.
22:17  <@MASTER> “Secuencia”: Composición de nucleótidos del ADN, o la de aminoácidos de una proteína. Puede puede corresponder a un gen, un genoma, o a una parte de ellos.
La obtención de estas secuencias (secuenciación) y en particular la del ADN completo de un organismo es el punto de partida de muchos proyectos de genómica.

Mediante técnicas de secuenciación, es posible “romper” el ADN e identificar la composición de pequeños fragmentos que luego se van uniendo hasta formar largas cadenas de letras (cada base del ADN se representa con una de las letras A, C, G o T). Éstas se almacenan en fichas en bases de datos

22:18 <@MASTER> ¿El código de la vida?

22:18 <@MASTER> Imaginemos que hemos encontrado un libro escrito en un lenguaje extraño del que no conocemos aún como se forman las palabras ni cuales son los símbolos de puntuación. De momento sabemos que ese libro es el manual de instrucciones del funcionamiento de un organismo. Ayudar a descifrarlo es la tarea básica de la bioinformática

22:18 <@MASTER> Por lo tanto hay que empezar por ver que dice el libro. Desafortunadamente no podemos leerlo completo de un tirón porque nuestras tecnología (unas gafas particulares por ejemplo) solo abarcan unas pocas líneas cada vez. Debemos pues leerlo por trocitos que cortamos al azar y que sí somos capaces de leer. Una vez leído cada pequeña parte tenemos que ensamblarlo como si fuera un puzzle, viendo qué piezas encajan con la siguiente (en palabras sencillas, el fin de una es igual al inicio de otra).

Curiosamente mientras la producción de datos crece, las técnicas computacionales para procesarlos se hacen más complejas. Se requieren algoritmos más complejos y máquinas más potentes.
En nuestro símil del libro de la vida, ahora ya tenemos todos sus símbolos ordenados en secuencia, pero desconocemos su significado, donde empiezan las recetas, donde se indican las cantidades a producir o combinar, etc.

22:20 * binario ¿es posible crear un servidor web con patatas?

22:20 <@MASTER> binario, sep

22:21 <@MASTER> Una de las primeras tareas de soporte bioinformático está en la gestión de los datos de la secuenciación. Aunque las primeras colecciones de datos se almacenan en ficheros “planos” (sin formato) por generalización se ha denominado como “bases de datos biológicas”

22:21 <@MASTER> Estas bases de datos contienen un conjunto de fichas de secuencias en las que, además de la secuencia en sí, se anotan otros datos de las mismas: se les da un código, se indica a que organismo pertenece, quien la descubrió… pero entre estas anotaciones, una de las más importantes se refiere a la “función” de dicho gen o proteína: qué es lo que hace?, en qué proceso biológico está involucrada?.

22:21 <@MASTER> La gestión de estos datos, su exposición pública en servidores accesibles por Internet es una de las áreas mas informáticas. La definición de estándares para almacenar y compartir con otros centros son tareas típicas de la gestión de datos de secuencias

Ejemplo de una secuencia genética (un virus): http://www.ncbi.nlm.nih.gov/nuccore/NC_001611.1?report=fasta&log$=seqview&format=text

 

Selección_002

22:22 <@MASTER> eso es una secuencia genética

22:23 <@MASTER> ¿dudas hasta aquí?

22:23 <@PUPILO> va bien

22:23 <@PUPILO> ¿como la bioinfo puede ayudar a sacar algoritmos sobre el cerebro humano?

22:24 <@MASTER> todo esta codificado en el ADN fantanaranja :)

22:24 <@PUPILO> ¿algún modelo de por ejemplo redes neuronales artificiales?

22:24 <@MASTER> las neuronas y su funcionamiento están codificadas pero no sabemos leer aun el ADN

22:24 <@MASTER> ahora comenzaremos con el análisis de secuencias

22:25 <@MASTER> 5 min para asimilar y continuamos

22:25 <@PUPILO> curioso ese virus

22:25 <@MASTER> y letal

22:25 <@PUPILO> ¿la bioinfo entonces es para saber interpretar ese código?

22:26 <@MASTER> sirve para muchas cosas

22:26 <@PUPILO> es como si existe un código del humano y esta ciencia lo que hace es intentar interpretarlo?

22:26 <@MASTER> claro hay q interpretarlo pero es tan vasto y grande

22:26 <@MASTER> q se precisan ordenadores. Una cadena de ADN humano son 3mil millones de pares de bases

22:27 <@PUPILO> ¿a qué se refiere con par de bases?

22:28 <@PUPILO> ¿doble hélice?

22:28 <@PUPILO> oh, ¿están hablando del taller de bioinformática?

22:29 <@PUPILO> hay mas átomos en una cadena de ADN que estrellas en el universo visible, la nueva temporada de cosmos se sale.

22:29 <@PUPILO> XD

22:30 <@MASTER> correcto

22:30 <@MASTER> las bases son los nucleotidos que forman la cadena de ADN y van emparejados

22:30 <@MASTER> A-T y C-G

22:31 * PUPILO si PUPILO , estamos ahora preguntando cosas.

22:31 <@MASTER> q va hombre los atomos de una cadena de dna se pueden contar

22:31 <@MASTER> lol

22:31 <@MASTER> ah universo visible ok

22:32 <@MASTER> mas dudas por favor. Esto es la base hay que tenerlo claro.

22:33 <@MASTER> binario, ahi tienes un server con Patatas lol http://d116.com/spud/spud.jpg

22:35 <@PUPILO> muy bonito

Servidor web realizado con patatas:

 

spud

22:36 <@PUPILO> nos pillas verdes, danos ejemplos.

22:39 <@PUPILO> la potencia de la bioinfo permitirá crear mutaciones de hombres y mujeres perfectos/as?

22:39 <@PUPILO> crees por tanto que esto generará diferentes clases sociales?

22:39 <@MASTER> para quien pueda pagarlo claro

22:39 <@PUPILO> es decir, que es un peligro probablemente

22:40 <@MASTER> teniendo las herramientas si

22:41 <@PUPILO> ¿es posible al día de hoy?

22:41 <@MASTER> por eso USA acusó a uno que monto un laboratorio en su garaje como bioterrorista

22:41 <@MASTER> ya te digo es cuestión de tener las herramientas

22:41 <@MASTER> el conocimiento lo tenemos, puedes crear una vacuna de la gripe o un virus mortal

22:41 <@MASTER> la diferencia es la colocación de las bases en la cadena

22:42 <@MASTER> el orden del DNA

22:43 <@MASTER> tu metes adn en un secuenciador de electroforesis

22:43 <@MASTER> y te sale algo como esto

22:43 <@MASTER> http://www.pnas.org/content/103/19/7240/F4.large.jpg

Ejemplo de ADN en un secuenciador de electroforesis:

 

F4.large

22:44 <@MASTER> una vez secuenciado los científicos lo suben a las bases de datos

22:44 <@MASTER> y hablamos de cualquier organismo vivo. Bacterias plantas animales…

22:45 <@MASTER> ¿mas dudas? 22:46 <@PUPILO> ¿por qué decías antes que no se puede entender el ADN referente a las neuronas cerebales?

22:46 <@PUPILO> ¿No sacan el patrón o algo?

22:47 <@MASTER> ahora comenzamos con el análisis de las secuencias. Es la segunda parte

Obtener los datos de las secuencias es el primer paso, en particular en los proyectos de genómica. “Interpretar el ADN significa conocer donde están los genes y cuales son las señales que los regulan”.

 

Esta área se enmarca dentro de la genómica funcional y va desde la identificación de las zonas que codifican hasta la asignación de función (cual es el trabajo que realiza dicha señal o cual es su significado, qué proteína sintetiza y en qué procesos biológicos interviene.

 

Por tanto, después del ensamblado se procede a la identificación de genes y señales de control.

 

La identificación de genes en procariotas es más sencilla puesto que prácticamente todo el ADN codifica para proteínas, pero en los eucariotas –humanos por ejemplo- aproximadamente solo el 3% del ADN codifica proteínas y está “oculto” en montañas de datos.

22:48 <@PUPILO> O_o

22:49 <@MASTER> Dentro del análisis de secuencias, la comparación entre ellas es posiblemente la tarea bioinformática más frecuente.

22:49 <@MASTER> Cuando se dispone de una nueva secuencia obtenida en el laboratorio la primera pregunta a resolver es ¿para que usa el organismo esta secuencia?, ¿cuál es su función?

Asignación de función por homología

 

La forma “bioinformática” de resolver el problema consiste en compararla con todas las secuencias conocidas, que se almacenan en las bases de datos. Si durante el proceso se encuentran secuencias “parecidas” a la secuencia desconocida, podemos inferir –por su parecido- que desarrollan funciones biológicas similares.

22:49 <@PUPILO> O_-

22:49 <@MASTER> ¿vale mas o menos no?

22:50 <@MASTER> también se usa el análisis para la obtención de arboles filogeneticos y comparar genes entre organismos.

22:51 <@MASTER> venga a mi me surgen muchas preguntas

22:52 <@PUPILO> ¿es verdad eso de que compartimos casi la misma estructura genética con el simio?

22:53 * lulzcat algunos más que otros

22:53 <@MASTER> si en un 99% compartimos los genes

22:53 <@MASTER> http://www.lavozdegalicia.es/sociedad/2007/09/28/00031190958276609862.htm

22:53 <@MASTER> ¿se puede quitar un gen de un organismo y meterlo en otro?

22:53 <@MASTER> Mirad la rana transparente

Rana transparente modificada geneticamente:

 

rana-transparente

22:54 * fantanaranja flipando con rana transparente

22:55 <@PUPILO> ¿pero han modificado a la rana para que sea transparente?

22:55 <@MASTER> Un mono que brilla en la oscuridad con genes de otros animales que brillan?

22:55 <@MASTER> https://bioweb.uwlax.edu/bio203/f2013/zaleski_rona/rhesus-monkey-glowing-animals_11831_600x450.jpg

22:55 <@PUPILO> ¿entonces la han modificado para ser transparente?

22:55 <@MASTER> claro

22:55 <@PUPILO> OMG

Mono que brilla en la oscuridad:

 

rhesus-monkey-glowing-animals_11831_600x450

22:56 <@MASTER> el mono fosforescente es epic lol

22:56 <@PUPILO> “cuando vayas al bar en el futuro te encontrarás a gente transparente”

22:56 <@PUPILO> ¿pero entonces será normal entrar a un bar en el futuro y que sea como Star Wars no?

22:56 <@PUPILO> gente parecida a cheewaka

22:56 <@MASTER> loool

22:57 <@PUPILO> otros transparentes y esas cosas.

22:57 <@MASTER> no se

22:57 <@MASTER> el futuro lo hacemos nosotros

22:58 <@MASTER> los genes son los que codifican, sí corto el gen que codifica algo en un organismo

22:58 <@MASTER> y lo pego en la cadena de otro organismo y hacemos que ese gen se exprese

22:58 <@MASTER> tenemos un mono fosforescente como las luciérnagas

22:59 <@MASTER> ahorraríamos en luz con perros fosforescentes xD

22:59 <@PUPILO> ¿en qué momentos de ante-vida o vida es más posible realizar ese tipo de modificaciones genéticas?

23:00 <@MASTER> ¿tu dices de conformar una cadena completa y ponerla a trabajar?

23:00 <@MASTER> pues como hace la vida. Con la mitosis y la meiosis

23:00 <@MASTER> metes el material genético en una célula

23:00 <@MASTER> y a esperar que se replique

23:00 <@PUPILO> esa foto es fake

23:00 <@PUPILO> vale, gracias

23:01 <@MASTER> fantanaranja, ¿esta prohibido hacerle eso a un mono?

23:01 <@MASTER> no es ético pero poder se puede hacer

23:01 <@PUPILO> bueno, lo veo mejor para un trabajador de carreteras

23:01 <@PUPILO> se ahorra ponerse el peto ese.

23:01 <@PUPILO> es flipante !

23:01 <@MASTER> esta prohibido hacerse un clon

23:01 <@MASTER> si esta prohibido

23:01 <@MASTER> es posible hacerlo? si

23:01 <@PUPILO> podemos clonarnos y tener un clon fluorescente?

23:02 <@MASTER> totalmente

23:02 <@PUPILO> yo quiero un clon fluorescente

23:02 <@MASTER> jajajaja

23:02 <@PUPILO> y dónde está el limite ético?

La bioética

 


La bioética es lo que hace que un científico no se levante un mal día en el que su mujer le ha puesto los cuernos y quiera liberar un virus pandemico.

23:02 <@PUPILO> y un clon con escamas?

23:02 <@MASTER> ahi entra la bioética

23:02 <@PUPILO> ¿qué es ético y qué no?

23:02 <@MASTER> efectivamente, ¿que hace que un científico no se levante un mal dia porque su mujer le ponga los cuernos y quiera liberar un virus pandemico?

23:03 <@MASTER> la bioética

23:03 <@PUPILO> ¿su buena conciencia?

23:04 <@MASTER> es muy importante

23:04 <@PUPILO> ¿eso existe? xD

23:04 <@MASTER> claro es una asignatura

23:04 <@MASTER> de biotecnologia

23:05 <@MASTER> ¿Qué es legal?

23:05 <@MASTER> ¿Que es ilegal?

23:06 <@PUPILO> ¿podríamos ponerle a ZP unas cejas fluorescentes?

23:06 <@PUPILO> xD

23:06 <@MASTER> es un poder muy grande poder clonar a alguien con un pelo

23:06 <@PUPILO> xDD

23:09 <@MASTER> sigamos

23:09 -!- lulzcat is now known as kasdelimon

23:09 <@MASTER> sabemos lo que son los genes

23:09 <@PUPILO> loool

23:09 <@kasdelimon> langus7: o/

La secuencia de aminoácidos que está codificada por un gen se conoce como la estructura primaria o lineal de la proteína.
Esta secuencia guarda relación lineal con el gen que la codifica. Esta relación está establecida por el código genético que para cada triplete de nucleótidos indica el correspondiente aminoácido.

 

Hay 20 aminoácidos, mientras que las bases del ADN son solamente 4.

 

Uno de los problemas que más cautiva (y que aún no se ha resuelto) es la predicción de la estructura de la proteína a partir de su secuencia de aminoácidos. Está demostrado que dicha estructura depende o está codificada íntegramente en la secuencia, pero el modelado de las interacciones entre átomos es un problema complejo en el que se dedica mucho esfuerzo de los grupos de investigación.

23:09 <@MASTER> voy a poner un vídeo para explicar esta parte

23:10 <@PUPILO> seee

23:10 <@MASTER> http://www.youtube.com/watch?v=_GhwvxDUiIw

23:11 <@PUPILO> videín ye!

23:12 <@MASTER> como veis en el vídeo así se conforma la estructura 3d de una proteína

23:13 <@PUPILO> a mi me odia, uso ff xDD

23:13 <@PUPILO> sorry

23:13 <@PUPILO> estamos mirando el vídeo aún

23:13 <@PUPILO> bueno, acaba de terminar

La información tri-dimensional de las estructuras de proteínas se almacena en bases de datos (por ejemplo, PDB: Protein Data Bank) en las que se incluye la posición espacial de cada uno de sus átomos lo que permite reproducir la conformación espacial de estas moléculas.

 

El problema es el siguiente:

 

Los genes modifican sus niveles de actividad o expresión como respuesta a determinados estímulos, o según la localización del tejido en que se encuentran, o en función del tiempo transcurrido de la respuesta, etc.

 

Estos cambios de expresión (de los niveles de proteínas sintetizadas por los genes) tienen una gran influencia en los procesos biológicos relacionados con los genes que cambian de nivel.

 

En realidad lo que siempre nos ha interesado son los niveles o las proporciones de las proteínas, ya que éstas son el descriptor elemental del estado de la célula o del mecanismo de respuesta de un organismo ante una condición particular. Sin embargo, la tecnología para proteínas aún no está del todo lista, y lo hacemos sobre genes, asumiendo una relación lineal entre el nivel de expresión del gen y la proporción de proteína (lo cual no deja de ser una hipótesis de trabajo).

 

Los experimentos de expresión génica permiten observar el comportamiento (niveles de expresión) dinámico de miles de genes ante determinadas condiciones experimentales.

 

Los genes modifican sus niveles de expresión en respuesta a estímulos externos, o dependiendo del tejido en que se encuentran, etc. Estos cambios alteran las proporciones relativas de proteínas en la célula y pueden tener efectos muy profundos en las funciones biológicas en las que intervienen, siendo la razón clave para detectar las alteraciones fisiológicas o patológicas y aqui vienen las enfermedades geneticas como el cancer.

 

Cuando un organismo no funciona correctamente se estima que los genes involucrados en el malfuncionamiento están teniendo niveles de expresión diferentes que el que tendrían en un tejido u organismo sano. Esta es la idea que subyace en los experimentos de expresión génica: detectar que genes (de un tejido enfermo, por ejemplo) tienen una expresión diferencial con respecto a un tejido de referencia (sano).

23:19 <@MASTER> ya he terminado

fanta

fanta

Puedes contactarme mediante email en fanta [at] elbinario.net conversar conmigo por jabber añadiendo fanta@hackingaround.tk

y compartir en la red Pump desde aquí: https://pumpdog.me/fanta

http://elbinario.net/2014/05/11/virtual-workshop-sobre-bioinformatica/

-Share this page-
submit to reddit Hire a Professional Programmer

compartí, discutí, comentá

Deja un comentario

Loading Facebook Comments ...