Биоинформатика

Лекции

 
 

Практика

 

 

 

 
Литература
А. Леск. Введение в биоинформатику. М., Бином, 2009.
С. Игнасимуту. Основы биоинформатики. М.-Ижевск, 2007.
Р. Дурбин, Ш. Эдди, А. Крог, Г. Митчисон. Анализ биологических последовательностей. М.-Ижевск, 2006.
М. Бородовский, С. Екишева. Задачи и решения по анализу биологических последовательностей. М.-Ижевск, 2008.
Физика белка. Курс лекций (А.В. Финкельштейн)
А.В. Ефимов. Структурные деревья глобулярных белков
А. Матросов, М. Чаунин. Самоучитель Perl. СПб.: БХВ-Петербург, 2001.

 

 

Вопросы для подготовки к зачету и экзамену по биоинформатике (после одного семестра) 
> теория 
1 Способы описания первичной структуры белков и нуклеиновых кислот. Формат FASTA. Парное и множественное выравнивание. 
2 Матрицы аминокислотных и нуклеотидных замен. 
3 Оценка выравнивания. Счет выравнивания, штрафы. Линейный и аффинный штрафы за делецию. Биологический смысл. 
4 Парное выравнивание. Точечные матрицы сходства. Фильтрация шума на матрицах. Интерпретация. 
5 Парное выравнивание. Алгоритм Нидлмана - Вунша. Алгоритм Смита - Ватермана. Применение различных видов выравнивания. 
6 Множественное выравнивание. Консенсусная последовательность и профиль выравнивания. Интерпретация результатов. Применение. 
7 Эвристические алгоритмы множественного выравнивания. Алгоритм Clustal. 
8 Оценка статистической достоверности выравнивания. Подход Bootstrap. Z-score, p-value, E-value, процент идентичности. Интерпретация. 
9 Поиск гомологичных последовательностей. Алгоритм BLAST. Терминология. Параметры поиска. 
10 Формат PDB. Структура файла. Программы для визуализации структур. Способы визуализации малых молекул и макромолекул (атомов, связей и вторичных структур). 
11 Характеристика конформации молекулы. Обозначения торсионных углов полинуклеотида и полипептида. Карты Рамачандрана. 
12 Виды филогенетических деревьев. Понятия и термины. Дерево как граф. 
13 Матрицы расстояний. Евклидово расстояние. Способы определения расстояния между последовательностями. 
14 Правила объединения групп. Формат Newick. Запись кладограмм и филограмм. 
 
> практика 
1 Поиск последовательностей и структур. Коды БД. Фильтрация результатов по разделам записей. 
2 Парное выравнивание. Выбор матриц и параметров штрафов. Оценка результатов. 
3 Множественное выравнивание. Выбор параметров. Условные обозначения строки консенсуса. Цветовые обозначения аминокислот. 
4 Поиск в BLAST. Интерпретация результатов. Графические обозначения. Счета выравниваний. Прочие параметры. 
5 Построение и анализ карт Рамачандрана. 
6 Работа с файлами PDB. Модели элементов первичной и вторичной структуры белков. Сопоставление структуры и последовательности. 
7 Поиск паттернов в белковых и нуклеотидных последовательностях. 
8 Построение филогенетического дерева по матрице расстояний разными методами. Запись дерева в формате Newick. 

 

 

Примеры практических заданий

1. Найдите записи в биологических банках данных, относящиеся к сывороточному альбумину (serum albumin) человека. Сколько аминокислот в этом белке? Какова его примерная молекулярная масса?

2. Какова доля совпадающих аминокислот в аргинин-киназах 1 и 2 морской лилии? Для поиска используйте запрос "arginine kinase Tropiometra macrodiscus".

3. Даны три белка: 3TK3_A, 4F5S_A, 1AO6_A. Какие два из них наиболее схожи по первичной структуре?

4. Даны 3 белка: gi|365177634, gi|90653010 и gi|116812902. Определите, какие два из них наиболее сходны по первичной структуре.

5. Наиболее сходны по первичной структуре:    Human albumin  -  Bos albumin  -  Porcine albumin

6. Выполните поиск гомологов для белка gi|116812902. К каким организмам относятся ближайшие гомологи?

7. Какой белок кодирует мРНК из файла А?   См. в конце страницы «Биоинформатика БашГУ»

8. Какой белок кодирует ДНК из файла В?   См. в конце страницы «Биоинформатика БашГУ»

9. Найдите структуру 1NAG. Какой аминокислотный остаток находится в 51-м положении? Какому элементу вторичной структуры он принадлежит?

10. Найдите структуру 4NCY. Найдите молекулу, находящуюся в комплексе с белком в области остатка G194. Определите структурную формулу этого вещества и молекулярную массу.

11. Какое низкомолекулярное вещество присутствует в структуре 3ZHW?    SO4    -   CO3   -    CH4

12. В состав какой регулярной структуры входит аминокислотный остаток Asp61 белка 6PCY?      Альфа-спирали    -    Бета-структуры    -    Никакой

13. Содержит ли белок с PDB ID 2CM4 дисульфидные связи? Сколько их?

 

 

Вопросы для подготовки к экзамену по биоинформатике (после двух семестров)

> теория
1 Способы описания первичной структуры белков и нуклеиновых кислот. Формат FASTA. Парное и множественное выравнивание.
2 Матрицы аминокислотных и нуклеотидных замен. Серии матриц PAM и BLOSUM, различия. Использование.
3 Оценка выравнивания. Счет выравнивания, штрафы. Линейный и аффинный штрафы за делецию. Биологический смысл.
4 Парное выравнивание. Точечные матрицы сходства. Фильтрация шума на матрицах. Интерпретация.
5 Парное выравнивание. Алгоритм Нидлмана - Вунша. Алгоритм Смита - Ватермана. Применение различных видов выравнивания.
6 Множественное выравнивание. Консенсусная последовательность и профиль выравнивания. Интерпретация результатов. Применение.
7 Эвристические алгоритмы множественного выравнивания. Алгоритм Clustal.
8 Оценка статистической достоверности выравнивания. Подход Bootstrap. Z-score, p-value, E-value, процент идентичности. Интерпретация.
9 Поиск гомологичных последовательностей. Алгоритм BLAST. Терминология. Параметры поиска.
10 Формат PDB. Структура файла. Программы для визуализации структур. Способы визуализации малых молекул и макромолекул (атомов, связей и вторичных структур).
11 Характеристика конформации молекулы. Обозначения торсионных углов полинуклеотида и полипептида. Карты Рамачандрана.
12 Виды филогенетических деревьев. Понятия и термины. Дерево как граф.
13 Матрицы расстояний. Евклидово расстояние. Способы определения расстояния между последовательностями.
14 Правила объединения групп. Формат Newick. Запись кладограмм и филограмм.
15 Принципы технологии секвенирования нового поколения. Ошибки секвенирования и их причины. 
16 Математические основы сборки последовательности. Термины: чтение, контиг, скаффолд. 
17 Формат FastQ. 
18 Способы определения первичной структуры белка. MALDI-TOF. Принципы метода и получаемые данные. 
19 Способы определения пространственной структуры белка. Метод ядерно-магнитного резонанса. Принципы метода и получаемые данные. 
20 Рентгеноструктурный анализ. Принципы. Оценка качества структуры, полученной методом РСА.
21 Искусственные нейронные сети. Разновидности. Обучение. Применение. 
22 Методы предсказания пространственной структуры РНК. Принципы и алгоритмы. 
23 Методы предсказания пространственной структуры белка. Принципы и алгоритмы. 
24 Буквенные обозначения вторичных структур белка. 
25 Этапы разработки лекарственного препарата. Термины. 
26 Принципы подбора лиганда в драг-дизайне. Фармакофор. 
27 Докинг. Принципы. Учитываемые параметры. Оценочная функция докинга. 
28 Проверка качества докинга. RMSD. 
 
> практика
1 Поиск последовательностей и структур. Коды БД. Фильтрация результатов по разделам записей.
2 Парное выравнивание. Выбор матриц и параметров штрафов. Оценка результатов.
3 Множественное выравнивание. Выбор параметров. Условные обозначения строки консенсуса. Цветовые обозначения аминокислот.
4 Поиск в BLAST. Интерпретация результатов. Графические обозначения. Счета выравниваний. Прочие параметры.
6 Работа с файлами PDB. Модели элементов первичной и вторичной структуры белков. Сопоставление структуры и последовательности.
7 Поиск паттернов в белковых и нуклеотидных последовательностях.

 

 

 

Имя файлаРазмер
heme.pdb_.txt3.44 КБ
a.txt1.44 КБ
b.txt1.47 КБ
C.txt4.02 КБ