Структуры данных для подготовки к собеседованиям по алгоритмам. pyhon.. pyhon. python.. pyhon. python. Алгоритмы.. pyhon. python. Алгоритмы. Карьера в IT-индустрии.. pyhon. python. Алгоритмы. Карьера в IT-индустрии. курсы программирования.. pyhon. python. Алгоритмы. Карьера в IT-индустрии. курсы программирования. менторство в it.. pyhon. python. Алгоритмы. Карьера в IT-индустрии. курсы программирования. менторство в it. основы программирования.. pyhon. python. Алгоритмы. Карьера в IT-индустрии. курсы программирования. менторство в it. основы программирования. подготовка к собеседованию.. pyhon. python. Алгоритмы. Карьера в IT-индустрии. курсы программирования. менторство в it. основы программирования. подготовка к собеседованию. Программирование.. pyhon. python. Алгоритмы. Карьера в IT-индустрии. курсы программирования. менторство в it. основы программирования. подготовка к собеседованию. Программирование. собеседование вопросы.. pyhon. python. Алгоритмы. Карьера в IT-индустрии. курсы программирования. менторство в it. основы программирования. подготовка к собеседованию. Программирование. собеседование вопросы. собеседования задачи.. pyhon. python. Алгоритмы. Карьера в IT-индустрии. курсы программирования. менторство в it. основы программирования. подготовка к собеседованию. Программирование. собеседование вопросы. собеседования задачи. структуры данных.. pyhon. python. Алгоритмы. Карьера в IT-индустрии. курсы программирования. менторство в it. основы программирования. подготовка к собеседованию. Программирование. собеседование вопросы. собеседования задачи. структуры данных. Учебный процесс в IT.

Структуры данных для подготовки к собеседованиям по алгоритмам - 1

Александр Чепайкин

Senior Developer в крупном финтехе. С 2012 года в IT, участвовал в разработке мобильных приложений, игр и сложных распределенных систем. Несколько лет работал удаленно в крупных стартапах Кремниевой долины. Построил эффективное обучение, пройдя которое, все мои студенты получают работу в IT.

Эта статья содержит список и краткое описание основных структур данных и предназначена для подготовки к алгоритмическим собеседованиям.

Нет смысла решать задачи, если вы не знаете как устроены основные структуры данных изнутри. Это необходимо, чтобы правильно их применять, при решении задач, и правильно оценивать алгоритмическую сложность.

Рекомендую также прочитать мою статью про алгоритмы и оценку сложности. Эти две статьи помогут вам подготовиться к алгоритмическим собеседованиям.

Я не преследую цель дать всю исчерпывающую информацию в одной статье – это лишь перечисление самых часто используемых структур данных с поверхностным пояснением.

В примерах я буду упоминать, как та или иная структура данных представлена в Python, но вы можете легко найти аналогичную информацию по любому языку программирования.

Если вы нанимаете, и готовы рассмотреть хорошего Junior+/Middle Python Backend, напишите мне в Telegram. Я учу людей программировать, а не просто проходить собеседования. Даже если прямо сейчас у вас нет вакансии, в будущем у вас появится потребность в хорошем Junior+, который готов к самостоятельной работе и может быстро расти до уровня Middle. Посмотрите как я обучаю, если у вас есть сомнения.

Используйте содержание и кнопку НАВЕРХ для удобства навигации по статье.

Массивы

Статический массив

Статический массив или просто массив – это структура данных, в которой количество элементов заранее определено и не может быть изменено во время выполнения программы и все элементы имеют один тип данных, например только int. При этом массив не является неизеняемым и значения в массиве можно изменить, но нельзя добавить новый элемент, так как длина массива фиксированная.

В Python нет традиционных статических массивов (как в C или Java), но в Python есть массивы с фиксированным типом элементов это модуль array. Они работают более эффективно, чем списки, но поддерживают только один тип данных.

array.array в Python под капотом использует динамический массив.

Хотя он работает похоже на статический массив, он не является статическим, потому что:

Он может изменяться в размере с помощью .append(), .extend(), .pop(), и т. д.
При нехватке памяти он перевыделяется (realloc()) аналогично list.
Под капотом у array.array используется C-массив, но с динамическим управлением памятью.

Так же в python есть tuple, который похож на статический массив, но позволяет хранить элементы разного типа. Под капотом в CPython для его релизации используется статический массив, но хранит в себе не сами объекты, а ссылки на них.

Смотрите реализацию tuple в CPython тут и тут, чтобы лучше понять как он устроен. Обратите внимание на _PyTuple_Resize в некоторых ситуациях tuple все таки может изменяться, но это происхдит в особых случаях, и он на самом деле не изменяется, а пересоздается заново.

Узел	Индекс в heap	Родитель (index)	Левый потомок (index)	Правый потомок (index)
1	0	– (корень)	1	2
2	1	0	3	4
3	2	0	–	–
4	3	1	–	–
5	4	1	–	–

Операция	Средний случай	Худший случай (при плохой хеш-функции)
Вставка	O(1)	O(n)
Поиск	O(1)	O(n)
Удаление	O(1)	O(n)

Функция	B-дерево	Б+-дерево
Где хранятся ключи?	Везде (во всех узлах)	Только в листьях
Где хранятся данные?	В узлах	Только в листьях
Как искать диапазон (BETWEEN)	Медленно	Быстро (связный список)
Где заканчивается поиск?	В любом узле	Всегда в листе

id	name	age	ctid
1	Alice	25	(5,1)
2	Bob	30	(5,2)
3	Charlie	22	(6,1)
4	Dave	35	(6,2)
5	Eve	28	(7,1)

Структуры данных для подготовки к собеседованиям по алгоритмам

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Александр Чепайкин

Содержание

Массивы

Статический массив

Динамический массив

Двумерные массивы (матрицы)

Реализация двумерных массивов в Python

Где используются двумерные массивы в реальных проектах?

Связные списки

Односвязный список

Двусвязный список

Циклические списки

Циклический список через collections.deque

Циклический список через itertools.cycle

Реализация циклического связного списка вручную

Стек (Stack)

Очереди (Queues)

FIFO (First In, First Out)

LIFO (Last In, First Out)

Реализация LIFO в Python

Используем queue.LifoQueue (потокобезопасный стек)

Двусторонняя очередь (Deque)

Очередь с приоритетом (Priority Queue)

Бинарная куча (Binary heap)

Как работает бинарная куча (Binary heap)

Как изменяется куча при вставке и удалении?

Минимальная куча (Min-Heap)

Максимальная куча (Max-Heap)

Хеш-таблица (Hash table)

Основные характеристики

Как работает хеш-функция

Что такое бакет (bucket)

Как выбирается бакет

Как работает resize в Хеш-таблице

Когда происходит resize

Как происходит resize

Почему нужно перехеширование (rehashing)

Влияние resize и rehashing на производительность

Худший случай в хеш-таблице

Оптимизация работы Хеш-таблицы

Деревья (Trees)

Бинарное дерево (Binary tree)

Общие сведения

Виды бинарных деревьев

Бинарные деревья поиска (BST)

Структура BST

Проблемы BST

Поиск элемента в BST

AVL деревья

Красно-черные деревья (Red-Black Tree)

Б-дерево (Btree)

Главные особенности B-дерева:

Правила B-дерева:

Пример структуры B-дерева

Б+-дерево (B+tree)

Почему PostgreSQL использует Б+-дерево?

Разница между B-деревом и Б+-деревом

Структура Б+-дерева для idx_users_age

Пример 2: Индекс по двум полям

Префиксные деревья (Tries)

Пример структуры Trie

Графы

Деревья (Tree)

Ориентированные графы (Direct Graph)

Неориентированные графы (Undirected Graph)

Взвешенные графы (Weighted Graph)

Двудольные графы (Bipartite Graph)

Сильно связные графы (Strongly Connected Graph)

Графы с циклами (Cyclic Graph)

Графы без циклов (Acyclic Graph)

Заключение