highload sites, master-class, ok-2009

Tags:

Post on 01-Nov-2014

2.798 Views

Category:

Technology

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

 

TRANSCRIPT

Разработка высоконагруженных проектов

Олег Бунин

Что такое “большой” проект?

• Сотни тысяч, миллионы, десятки миллионов хитов;

• Бесперебойная работа;• Сложная структура: серверный

парк, большое количество кода;

• Большое количество данных.

В чем измерять нагрузку?• Посетители;• Хосты;• Хиты.

Технический отдел меряет посещаемость в хитах! Имея прогноз посещаемости можно сделать выводы о использовании процессора, памяти и жестких дисков.

Зависимость серверного парка от типа проекта

Отношение hit ratio Количество серверов при одинаковой посещаемости

Корпоративный сайт 1:3 1

СМИ 1:4 1

Интернет-магазин 1:5 1

Фотохостинг 1:10 3

Блогосфера 1:100 5

Социальная сеть 1:50 5

Видеохостинг 1:10 5

Сайт знакомств 1:50 5

Онлайн-игра 30

Это сравнительная таблица, количество серверов указано относительное именно для сравнения , а не как абсолютные цифры.

Что такое рост нагрузки с технической точки зрения?

Типы роста нагрузки

• Рост ресурсов, требуемых на обработку потока запросов;

• Рост ресурсов, требуемых для хранения пользовательских данных;

• Рост ресурсов, требуемых для передачи данных между пользователями и сервером.

Типичные узкие места проектовПотенциальные проблемы производительности

Корпоративный сайт

СМИ База данных с большим количеством статей, производительность базы данных

Интернет-магазин Производительность серверов

Фотохостинг Скорость и объемы жестких дисков

Блогосфера Производительность серверов, скорость и объемы жестких дисков

Социальная сеть Производительность серверов

Видеохостинг Скорость и объемы жестких дисков

Сайт знакомств Производительность серверов

Онлайн-игра Производительность серверов

Требуемые ресурсы при росте посещаемости

1 2 3 4 5 6 7 80

2

4

6

8

10

12

14

16

18

СМИВидеохостингСайт знакомствОнлайн-игра

Масштабиро-вание

Горизонтальное

масштабирование (scaling

out)

Вертикальное масштабирование (scaling

up)

Функциональное

разделение (partitioning)

Шардинг (sharding

)

Общее решение

Горизонтальное масштабирование

Увеличение производительности системы за счет подключения дополнительных cерверов.

Отлично работает для вычисляющих серверов, а как быть с базой данных?

Что делать со связанными общими для нескольких серверов данными?

Вертикальное масштабирование

Увеличение производительности системы за счет увеличения мощности сервера.

В какой-то момент мы все равно достигнем предела по процессору, памяти или жесткому диску.

Функциональное разбиение

Разные функциональные части работают и хранятся на разных серверах системы.

В какой то момент мы все равно упремся в физические возможности сервера.

Шардинг

Разбиение данных на кусочки, которые раскладываются по

серверам-шардам.Как правильно разбить данные для шардинга? Как правильно идентифицировать данные?

У них просто нет выбора:

Разбиение данных для шардингаСтатическое: по первой букве логина, хэширование идентификаторов или логинов. Единого центра нет, соответственно нет узкого места, зато есть сложности с разрешением заранее непредусмотренных ситуаций.

Динамическое: есть координирующий центр, который отвечает на вопрос “где лежит”? Он

же является узким местом, зато добавление новых серверов происходит без

изменения кода.

Как облегчить масштабирование?• Низкая степень связности данных и кода;• Разделение кода на слои (как минимум слой связи с базой данных и слой кэширования);• Рефакторинг, высокое качество кода, минимизация workaround’ов;• Контроль над системой, мониторинг;• Минимизация академических решений (построение таблиц “на лету”, ORM).

Масштабируем

аяархитек

тура

Слабосвязанная

Слоистая

Горизонтальное

масштабирование

Асинхронные

вычисления

Серебряная пуля

Отдельно о базах данныхБаза данных – типичное узкое место. Для базы

данных актуальны все вышеперечисленные

методы увеличения производительности:

горизонтальное и вертикальное масштабирование, функциональное разбиение, шардинг.

Горизонтальное масштабирование в случае с БД достигается с помощью репликации.

РепликацияСинхронизация нескольких копий объекта.

Наиболее эффективна при небольшом количестве слейвов, иначе усложняется схема распространения изменений, которое, в дальнейшем, становится узким местом.Усложнение программной архитектуры – например, чтение данных с слейва, до которого не докатились изменения.

Типичная архитектура: обычный сайт

Frontend

Design images

nginx memcached

DNS-БалансингDNS-Балансинг

Image Server / 2

User images

nginx Backend / 1

PHP

Backend / 2

PHP

Backend / 3

PHP

Демоны

Database / 1

MySQL

Database / 2

MySQL для блогов

Image Server / 1

User images

nginx

Структура типичного веб-проекта• Фронтенд – легкий быстрый сервер,

отвечающий за отдачу статических картинок;

• Бекенд – тяжелый программный сервер, производящий вычисления и строящий веб-страницы;

• База данных, хранилище данных.

Узкие местаУзкое место Характерно для… Решается…

Производительность вычисляющих серверов (бекендов)

Для всех типов сайтов, особенно для социальных сетей и блогосфер

Добавление новых серверов, изменением архитектуры программного обеспечения

Данные не помещаются в оперативную память

Для некоторых конкретных сервисов: поиск, поиск на сайте знакомств, построение френдленты, коллаборативная фильтрация.

Покупка более подходящего аппаратного обеспечения или изменение архитектуры программного обеспечения

Данные не влезают на диск

Для фотохостингов, видеохостингов

Разбиение хранилища на части и написание специального алгоритма маршрутизации файла (например, по его имени). Разные части разносятся на разные сервера

Данные нельзя разбить, но они не влезают на один диск

Для почтовых систем, поисковых систем

Покупка специальных дисковых хранилищ – дорогие устройства с повышенной емкостью.

Узкие места - 2Узкое место Характерно для… Решается…

Объем отдаваемого трафика

Характерно для видеохостингов, онлайн-игр и любых крупных проектов

Покупка дополнительных серверов (фронтендов), покупка специального маршрутизирующего аппаратного обеспечения. Также возможна аренда более мощного канала и изменение топологии серверного парка

Производительность базы данных

Крупные СМИ, интернет-магазины

Покупка или аренда специализированных серверов для базы данных. Оптимизация и тюнинг базы данных.

Объем и производительность базы данных

Для любого крупного сайта

В качестве первого шага возможна настройка кластера баз данных или репликации, когда базу данных обслуживает несколько серверов.Более долгосрочное решение – переписывание программного кода так, чтобы он работал с несколькими базами данных или вообще без них.

Развитие проекта

Рефакторинг, изменение

архитектуры

Рост посещаемости

через оптимизацию

Невозможность дальнейшего

роста посещаемости,

технологическое ограничение

Быстрый рост нагрузки – что делать?

Быстрая помощь• Программные решения наиболее эффективны, но требуют много

времени;

• Требуемый уровень специалистов иногда запредельно высок;

• Хостинг;

• Более мощное аппаратное обеспечение;

• Покупка Oracle ;-)

• Редуцирование функциональности;

• Уменьшение качества;

• Оптимизация нагрузки;

Прогнозирование нагрузки• Нагрузочное тестирование. Организация

нагрузочного тестирования. Почему стоит заказывать нагрузочное тестирование на стороне?

• Формулы экстраполяции результатов тестирования на реальную работу. Пиковый характер http-трафика. “Тестирование сферического коня в вакууме”.

• Опытные оценки, примеры.

oleg.bunin@ontico.ruLiveJournal: oleg_bunin

top related