math

Введение - зачем программисту математика

Математика для программиста - это не абстрактная дисциплина из университетского курса, а рабочий инструмент. Без понимания логарифмов невозможно оценить сложность алгоритма. Без теории вероятностей не получится грамотно провести A/B тест. Без линейной алгебры не разберёшься в машинном обучении. Без дискретной математики не поймёшь, как работают графы, деревья и конечные автоматы.

При этом не вся математика одинаково важна для инженера. Практическая значимость разделов распределяется примерно так:

Дискретная математика - фундамент компьютерных наук. Логика, множества, графы, комбинаторика - всё это ежедневные инструменты
Алгебра и логарифмы - анализ сложности алгоритмов невозможен без этих знаний
Теория вероятностей и статистика - продуктовая аналитика, машинное обучение, принятие решений на основе данных
Линейная алгебра - машинное обучение, компьютерная графика, рекомендательные системы
Математический анализ - оптимизация в ML, физические симуляции
Теория чисел - криптография, хеш-функции
Геометрия и тригонометрия - разработка игр, компьютерная графика, геолокация

Принцип изучения

Не нужно осваивать всё сразу. Начните с дискретной математики и теории сложности - они пригодятся в первый же день работы. Остальное изучайте по мере необходимости, когда конкретная задача потребует конкретных знаний.

Арифметика и числа

Виды чисел

Числа образуют иерархию множеств, где каждое следующее множество включает предыдущее.

Натуральные числа $N$ - это числа для счёта предметов: $1, 2, 3, 4, \dots$ В некоторых определениях ноль тоже считается натуральным числом. В программировании натуральные числа встречаются повсюду - индексы массивов, количество элементов, номера итераций.

Целые числа $Z$ расширяют натуральные добавлением нуля и отрицательных чисел: $\dots, - 3, - 2, - 1, 0, 1, 2, 3, \dots$ Типы int, int32, int64 в языках программирования представляют подмножество целых чисел, ограниченное размером типа.

Рациональные числа $Q$ - это все числа, которые можно представить в виде дроби $\frac{p}{q}$ , где $p$ и $q$ - целые числа, а $q \neq = 0$ . Примеры: $\frac{1}{2}$ , $\frac{7}{3}$ , $- \frac{5}{8}$ . Любое рациональное число при записи десятичной дробью либо конечно, либо образует периодическую последовательность цифр.

Иррациональные числа - это числа, которые нельзя представить дробью. Их десятичная запись бесконечна и непериодична. Примеры: $2 \approx 1.41421356 \dots$ , $π \approx 3.14159265 \dots$ , $e \approx 2.71828182 \dots$

Вещественные числа $R$ объединяют рациональные и иррациональные числа. Типы float32, float64, double в программировании приближённо представляют вещественные числа.

Целочисленное переполнение

Целые числа в компьютере ограничены размером типа. Для int32 максимальное значение - $2^{31} - 1 = 2147483647$ . При превышении этого значения происходит переполнение, и число “оборачивается” через минимальное значение. Это источник серьёзных багов - именно из-за переполнения int в 2014 году счётчик просмотров видео Gangnam Style на YouTube перестал работать.

Системы счисления

Система счисления определяет, как числа записываются с помощью цифр. В повседневной жизни используется десятичная система с основанием 10. В программировании критически важны ещё три системы.

Двоичная система имеет основание 2 и использует только цифры 0 и 1. Компьютер на самом низком уровне работает именно с двоичными числами, потому что транзистор имеет два состояния - включён и выключен. Число в двоичной системе раскладывается по степеням двойки:

$101 1_{2} = 1 \cdot 2^{3} + 0 \cdot 2^{2} + 1 \cdot 2^{1} + 1 \cdot 2^{0} = 8 + 0 + 2 + 1 = 1 1_{10}$

Восьмеричная система использует основание 8 и цифры от 0 до 7. В современном программировании встречается редко, но используется, например, для задания прав доступа к файлам в Unix-системах. Запись chmod 755 означает: владелец - полные права (7 = 111 в двоичной = rwx), группа - чтение и выполнение (5 = 101 = r-x), остальные - чтение и выполнение (5 = 101 = r-x).

Шестнадцатеричная система использует основание 16 и цифры 0-9, а также буквы A-F для значений 10-15. Это компактная запись двоичных данных - каждая шестнадцатеричная цифра представляет ровно 4 бита. Широко используется для записи цветов в CSS (#FF5733), адресов памяти, MAC-адресов, хешей.

$FF_{16} = 15 \cdot 1 6^{1} + 15 \cdot 1 6^{0} = 240 + 15 = 25 5_{10} = 1111111 1_{2}$

Перевод между двоичной и шестнадцатеричной системами делается группами по 4 бита:

Двоичное:   1010 1111 0011 1100
Hex:         A    F    3    C
Результат:  0xAF3C

Перевод целого числа из десятичной системы в другую выполняется последовательным делением на основание новой системы. Остатки от деления, записанные в обратном порядке, дают результат:

42 в двоичную:
42 ÷ 2 = 21, остаток 0
21 ÷ 2 = 10, остаток 1
10 ÷ 2 = 5,  остаток 0
5  ÷ 2 = 2,  остаток 1
2  ÷ 2 = 1,  остаток 0
1  ÷ 2 = 0,  остаток 1

Читаем снизу вверх: 101010
42₁₀ = 101010₂

Битовые операции

Понимание двоичной системы необходимо для работы с битовыми операциями: AND (&), OR (|), XOR (^), NOT (~), сдвиги (<<, >>). Битовые маски используются для компактного хранения флагов, прав доступа, состояний. Например, права пользователя можно хранить как одно число: READ = 1 (001), WRITE = 2 (010), EXECUTE = 4 (100). Проверка наличия права: if (permissions & READ) != 0.

Модулярная арифметика

Модулярная арифметика работает с остатками от деления. Операция “остаток от деления” записывается как $a mod n$ или $a % n$ в большинстве языков программирования. Результат - это остаток от деления $a$ на $n$ .

$17 mod 5 = 2 (потому что 17 = 3 \cdot 5 + 2)$

Два числа называются сравнимыми по модулю $n$ , если они дают одинаковый остаток при делении на $n$ . Записывается как:

$a \equiv b (mod n)$

Это означает, что разность $a - b$ делится на $n$ .

Основные свойства модулярной арифметики:

$(a + b) mod n = ((a mod n) + (b mod n)) mod n$ $(a \cdot b) mod n = ((a mod n) \cdot (b mod n)) mod n$

Эти свойства позволяют вычислять остатки для очень больших чисел, не вычисляя сами числа. Например, $2^{100} mod 7$ можно вычислить, последовательно возводя в квадрат и беря остаток на каждом шаге.

Программисты используют модулярную арифметику постоянно:

Хеш-таблицы: индекс корзины вычисляется как hash(key) % table_size
Циклические буферы: следующая позиция вычисляется как (current + 1) % buffer_size
Определение чётности: число чётное, если n % 2 == 0
Криптография: алгоритм RSA полностью основан на модулярной арифметике
Генераторы случайных чисел: линейный конгруэнтный метод использует формулу $x_{n + 1} = (a \cdot x_{n} + c) mod m$

Порядок операций

Математические операции выполняются в определённом порядке приоритетов:

Скобки
Степени и корни
Умножение и деление (слева направо)
Сложение и вычитание (слева направо)

В программировании добавляются дополнительные уровни для битовых операций, операций сравнения и логических операций. Порядок различается между языками, поэтому при сомнениях лучше использовать явные скобки.

НОД и НОК

Наибольший общий делитель двух чисел $a$ и $b$ - это наибольшее число, на которое оба числа делятся без остатка. Записывается как $g cd (a, b)$ или НОД $(a, b)$ .

Алгоритм Евклида - один из древнейших алгоритмов в математике и при этом один из самых элегантных. Идея проста: $g cd (a, b) = g cd (b, a mod b)$ , а $g cd (a, 0) = a$ .

gcd(48, 18):
  gcd(48, 18) → gcd(18, 48 % 18) → gcd(18, 12)
  gcd(18, 12) → gcd(12, 18 % 12) → gcd(12, 6)
  gcd(12, 6)  → gcd(6, 12 % 6)   → gcd(6, 0)
  gcd(6, 0)   → 6

НОД(48, 18) = 6

Наименьшее общее кратное вычисляется через НОД:

$lcm (a, b) = \frac{∣ a \cdot b ∣}{g c d ( a , b )}$

Для примера выше: $lcm (48, 18) = \frac{48 \cdot 18}{6} = 144$ .

Где это используется в программировании:

Сокращение дробей - делим числитель и знаменатель на их НОД
Синхронизация периодических задач - НОК определяет период совместного повторения
Криптография - расширенный алгоритм Евклида применяется в RSA для нахождения модулярного мультипликативного обратного

Числа с плавающей точкой и IEEE 754

Один из самых частых источников недоумения у начинающих программистов - это поведение чисел с плавающей точкой. Попробуйте в любом языке выполнить 0.1 + 0.2, и вы получите 0.30000000000000004 вместо ожидаемого 0.3.

Причина кроется в стандарте IEEE 754, который определяет, как вещественные числа хранятся в памяти компьютера. Число представляется в виде:

$(- 1)^{s} \times m \times 2^{e}$

где $s$ - знаковый бит, $m$ - мантисса, $e$ - экспонента. Для 64-битного числа (double, float64) отводится 1 бит на знак, 11 бит на экспоненту и 52 бита на мантиссу.

Проблема в том, что число 0.1 в двоичной системе является бесконечной периодической дробью - аналогично тому, как $\frac{1}{3} = 0.333 \dots$ является бесконечной в десятичной. При записи в конечное количество бит происходит округление, и точное значение теряется.

$0. 1_{10} = 0.0001100110011001100110011 \dots_{2}$

Практические последствия:

Никогда не сравнивайте числа с плавающей точкой через ==. Используйте сравнение с допуском: |a - b| < epsilon
Для финансовых вычислений используйте целые числа (центы вместо долларов) или специальные типы (Decimal в Python, BigDecimal в Java)
Порядок операций влияет на точность. Сложение очень маленького числа с очень большим может привести к потере маленького числа
При накоплении ошибок в циклах суммирования используйте алгоритм Кэхэна

Ключевые понятия раздела

Двоичная и шестнадцатеричная системы счисления - основа работы с данными на низком уровне. Модулярная арифметика лежит в основе хеш-таблиц и криптографии. Алгоритм Евклида для НОД - пример элегантного рекурсивного алгоритма. Числа с плавающей точкой имеют фундаментальное ограничение точности - это нужно учитывать при написании кода.

Алгебра

Выражения, уравнения, неравенства

Алгебраическое выражение - это комбинация чисел, переменных и операций: $3 x^{2} + 2 x - 5$ . Выражение можно вычислить при подстановке конкретных значений переменных.

Уравнение утверждает равенство двух выражений: $3 x + 7 = 22$ . Решить уравнение - значит найти значения переменных, при которых равенство выполняется.

Неравенство использует знаки сравнения вместо равенства: $2 x + 3 > 11$ . Решением неравенства является не одно число, а множество значений.

В программировании эти понятия присутствуют повсюду. Каждое условие if - это проверка неравенства или равенства. Каждое выражение в коде - это алгебраическое выражение. Каждый поиск значения в задаче оптимизации - это решение уравнения.

Линейные уравнения и системы

Линейное уравнение с одной переменной имеет вид $a x + b = 0$ , его решение тривиально: $x = - \frac{b}{a}$ при $a \neq = 0$ .

Система линейных уравнений с двумя неизвестными:

${a_{1} x + b_{1} y = c_{1} a_{2} x + b_{2} y = c_{2}$

Решается методом подстановки, методом сложения или через определители (формулы Крамера):

$x = \frac{c _{1} b _{2} - c _{2} b _{1}}{a _{1} b _{2} - a _{2} b _{1}}, y = \frac{a _{1} c _{2} - a _{2} c _{1}}{a _{1} b _{2} - a _{2} b _{1}}$

Знаменатель $a_{1} b_{2} - a_{2} b_{1}$ - это определитель матрицы коэффициентов. Если он равен нулю, система либо не имеет решений, либо имеет бесконечно много решений.

Линейные системы с большим количеством переменных решаются методом Гаусса, который рассматривается в разделе линейной алгебры.

Где линейные уравнения встречаются в программировании: линейная интерполяция между двумя значениями (анимации, градиенты), вычисление пересечения отрезков, линейная регрессия.

Квадратные уравнения

Квадратное уравнение имеет вид:

$a x^{2} + b x + c = 0, a \neq = 0$

Дискриминант определяет количество корней:

$D = b^{2} - 4 a c$

Если $D > 0$ - два различных вещественных корня
Если $D = 0$ - один корень (два совпадающих)
Если $D < 0$ - нет вещественных корней (два комплексных)

Формула корней:

$x_{1, 2} = \frac{- b \pm D}{2 a}$

Квадратные уравнения возникают при расчёте траекторий (баллистика в играх), при нахождении точек пересечения окружностей (геолокация), при оптимизации квадратичных функций.

Формулы сокращённого умножения

Эти тождества полезны для упрощения выражений и быстрых вычислений:

Base

Проводник

math

Введение - зачем программисту математика

Арифметика и числа

Виды чисел

Системы счисления

Модулярная арифметика

Порядок операций

НОД и НОК

Числа с плавающей точкой и IEEE 754

Алгебра

Выражения, уравнения, неравенства

Линейные уравнения и системы

Квадратные уравнения

Формулы сокращённого умножения

Вид графа

Оглавление