Programming stuff: О сомнительных советах об эффективности

понедельник, 30 мая 2016 г.

О сомнительных советах об эффективности

Давать советы об эффективности тех или иных языковых конструкций довольно сложно, поскольку мало в каком языке есть конструкции с заведомо плохой эффективностью. Обычно разные языковые конструкции предназначены для решения хоть и похожих, но несколько разных задач. Например, цикл for в C# работает только с индексируемыми коллекциями, поэтому сравнивать его с циклом foreach в общем случае некорректно.

Но самая главная проблема появляется тогда, когда в совете об эффективности той или иной фичи не объясняется ситуация, в которой этот совет является применимым. Вроде бы, цитату Кнута/Хоара о преждевременной оптимизации знают все, но продолжают давать советы об эффективности в ультимативной форме.

Вот и сегодня мне встретился такой совет, который ретвитнули несколько человек в моей ленте. Совет с самой мудростью, доступной лишь посвященным, но якобы полезной любому .NET разработчику:

Great high-performance tips for .NET developers pic.twitter.com/EepLub5cl9
— Morten Nielsen (@dotMorten) May 29, 2016

Проблема #1. Отсутствие контекста

Как обычно, когда дается совет о производительности, должен быть DISCLAIMER: «Не меняйте свой код исходя из нижележащих советов. Задайте перф-цель, измерьте текущую производительность; если есть проблема запустите профайлер и найдите проблемные участки и в них, возможно, воспользуйтесь моими советами».

Например, совет по поводу LINQ-а валиден. Но ведь он валиден в 0.001% кода. В кишках Розлина LINQ и правда запрещен, как и запрещен он в кишках Решарпера и в критических кусках нового билд-движка, над которым работает моя команда. Но запрещен он не во всех этих проектах, а лишь в нескольких участках, наиболее требовательных к производительности.

Вообще, совет с LINQ-ом особенно плох, поскольку C# не предоставляет средств с соизмеримой выразительностью. Если не особо разобравшийся в теме разработчик начнет следовать этому совету в своем чудо ЫнтЫрпрайз проекте, то он существенно испоганит код, не получив никакой выгоды.

В перф-критикал коде вполне возможно использование кастомных коллекций (что делают каждый из перечисленных мною проектов), поскольку накладные расходы стандартных по памяти будут неприемлемыми. В перф-критикал коде действительно выделение памяти на енумератор может быть проблемным. Но в абсолютном же числе случаев, LINQ будет вполне ОК, и не нужно от него отказываться!

Проблема #2. Совет по поводу лямбд: Do not use lambdas, as they cause allocations

Совет очень плох, поскольку он ну, очень плох. Я могу понять совет подобного рода: «остерегайтесь использования делегатов, поскольку они имеют несколько большую цену вызова чем экземплярный метод и неосторожное их создание может привести к ненужным выделениям памяти. Но, как всегда, пожалуйста, запустите профайлер и убедитесь, что проблема есть».

Я для нашего проекта портировал компилятор TypeScript на C# (пока не скажу «зачем»), и вместе с кодом парсера и сканнера, перевел и код обхода дерева. Метод обхода рекурсивный и он вызывает себя для всех дочерних узлов. При этом, в теле метода был такой код:

public static void WalkTree(Node node, Action<Node> callBack)
{
    // Создавем функцию обхода
    Action<Node> walker = ProcessNode;
            
    // Используем ее внутри!
    walker(node);
}
 
private static void ProcessNode(Node node)
{            
}

Поскольку Method Group Conversion, который происходит при создании переменной walker всегда приводит к аллокации нового делегата, то профайлер показал, что 10% процентов времени обхода занимает создание делегата. Замена этого кода на лямбда-выражение устранило проблему, поскольку лямбда-выражения могут быть закешированы, если они не захватывают внешнего контекста:

public static void WalkTree(Node node, Action<Node> callBack)
{
    // Создавем функцию обхода
    Action<Node> walker = (n) => ProcessNode(n);
            
    // Используем ее внутри!
    walker(node);
}

Да, компилятор сможет закешировать лишь незахватывающие лямбда-выражения, но ведь совет говорит, что лямбды плохо – ибо аллокации. А это в общем случае не совсем верно, а в некоторых случаях не верно совсем;)

Проблема #3. Beware of boxing!

И далее:

“A common case for that is passing structs to a method that takes an interface as a parameter. Instead, make the method take the concrete type (by ref) so that it can be passed without allocation.”

Тут есть несколько моментов. Во-первых, мне сложно сказать, насколько статистика верна и что проблема с упаковкой действительно зачастую проявляется именно из-за передачи структур в методы, которые принимают интерфейсы. Во-вторых, фраза не точная, ведь если обобщенный метод принимает интерфейс через ограничение, то упаковки не будет:

public static void NoAllocations<T>(T comparable) where T : IComparable
{ }

Ну и в третьих, в совете говорится о передаче структур по ссылке, что может сильно запутать читателя кода, поскольку семантика передачи чего-то по значению и по ссылке очень и очень разные.

Проблема #4. Prefer structs to classes whenever you can.

Этот совет тоже оторван от реальности и является опасным. В предыдущем совете о передаче аргументов метода кратко упоминается передача по ссылке. Хотя объяснения там нет, причина передачи по ссылке заключается в том, что это избавляет от копирования структур при вызове метода, что может быть существенным для структур большого размера.

Но проблема заключается в том, что структуры по своей природе копируются еще во многих других случаях, и даже тогда, когда мы с вами можем и не подозревать, и там, где ключевое слово ref всунуть нельзя:

Возвращаемое значение метода
Свойство
Readonly поле (!!!)

Причем последнее неоднократно являлось причиной лулзов, причем даже среди весьма опытных и даже именитых товарищей (читайте подробнее у Джона Скита - Micro-Optimization: The Surprising Inefficiency Of Readonly Fields). И это я не говорю о том, что вам могут понадобиться мутабельный типы, которые реализовывать в виде структур категорически не рекомендуется.

(да, и тут нужно не забывать, что значимые типы не сильно дружат с ООП, а значит ваш дизайн может серьезно пострадать, если вы ненароком последуете этому совету).

Проблема #5. Ложь и провокации

… которая заключается в последнем совете: “Avoid foreach loops on everything except raw arrays. Each call on a non-array allocates an enumerator. Prefer regular for loops whenever possible.”

Так вот, енумераторы всех коллекций в BCL являются структурами (да, изменяемыми структурами!). Так что foreach на них не будет приводить к аллокациям! Точка!

Foreach с массивами работает быстрее, просто потому что там вообще не используются никакие итераторы. Компилятор C# для цикла foreach с массивами просто берет и генерирует цикл for. Именно поэтому он в микробенчмарке будет быстрее, чем foreach на списке.

К тому же, существует сверх малое число сценариев, когда накладные расходы перебора элементов будут играть хоть какую-то роль по сравнению с телом самого цикла. Если вдруг, этот случай настанет, то нужно оптимизировать именно его, а не переводить все циклы на for!

К тому же, если перебор элементов массива быстрее, чем перебор элементов других коллекций, означает ли это, что нам нужно избегать любых других коллекций кроме массивов? Если да, то как быть, если размер заранее неизвестен?

Вместо заключения

Производительность – тема сложная. Она сложна сам по себе, но она становится еще сложнее, когда разработчике в проекте начинают подходить к ней фанатично. Я как-то немного устал разгребать низкокачественный низкоуровневый код, который был написан разработчиками, слишком буквально следовавшими подобным советам. В результате всегда получался код, который тяжело читать, понимать и развивать. А значит и находить, и исправлять в нем настоящие проблемы с производительностью всегда было очень сложно.

Давайте думать о производительности, но давайте не следовать культу карго и не портить дизайн решения вслепую. Если уж придется его портить, то пусть это будут те самые 2-3% кода, где это действительно нужно.

P.S. Ну и, на всякий случай, это не только я, кому показался этот набор советов сомнительным. Вот мнение ПМ-а .NET-а:

@dotMorten Unfortunately, some advice is actually incorrect/misleading :-( Performance is a vast topic and clear cut advice is hard.
— Immo Landwerth (@terrajobst) May 29, 2016

48 комментариев:

Andrew Zakharkin30 мая 2016 г. в 08:21
У Скита в конце статьи приписочка, что в Roslyn что-то поменяется (он надеется). Поменялось или нет, ты не знаешь?
ОтветитьУдалить
Ответы
zloy den30 мая 2016 г. в 08:45
Вот соглашусь. Писать более-менее вменяемый код с т.з. алгоритмов - нормально. Ну т.е. не надо углубляться и писать свою сортировку каждый раз, но попросту стоит избавиться (точнее, сразу не писать таким образом) от какого-нибудь lazy load в цикле при использовании ORM.
Но вот заниматься микрооптимизациями вслепую - большое зло. Читать это потом становится трудно. Не говоря о том что у самих разработчиков появляется ощущение что они "всё правильно сделали" и любые замечания будут зачастую восприниматься в штыки с формулировкой "ты что, хочешь чтобы мы писали тормозную гадость?".
Ну и как обычно - очень часто разработчики плохо на самом деле представляют где и что на самом деле тормозит (потому что это зачастую действительно неочевидно). И тыкаться вслепую вместо использования профайлера довольно глупо.
У меня был случай, когда понадобилось оптимизировать долгоработающий метод (мог занимать несколько минут, хитрая обработка документов с кучей IO). Но вместо того чтобы кинуться убирать foreach-и, переписывать всё на структуры и избавляться от Linq-а, я сделал наоборот - постарался сделать код максимально понятным. Потом уже профайлер + устранение ставших очевидными косяков помогли ускорить всё это раз в 15 (что было уже приемлемо, хотя можно было и больше выжать). Сохранив функциональность и улучшив читабельность при этом. И, кстати, основной источник тормозов крылся там, где я бы ни в жизнь не подумал его искать - одно из безобидных на вид read-only свойств класса для аутентификации делало вызовы к сервису при каждом вызове. Без профайлера я бы это не нашел.
ОтветитьУдалить
Ответы
Mikhail Barg30 мая 2016 г. в 10:44
Обычно в разговорах про избегание преждевременной оптимизации фигурирует и обратная сторона монеты — избегание (преждевременной?) пессимизации. Базовая мысль проста — не надо писать заведомо плохой код. Ну например — конкатенацию строк в цикле. Или использовать list.Count() вместо list.Count.

У Саттера есть огромный список того, что он относит к пессимизации (правда в рамках C++). И вроде бы понятно, чем пессимизация отличается от преждевеременной оптимизации — в случае пессимизации и хорошее и плохое решения имеют примерно одинаковые характеристики по времени написания и читабельности, то есть написать "плохой" вариант ничем не выгоднее, чем "хороший". Например Саттер относит к пессимизации бездумное использование постфиксного инкремента вместо префиксного — ясно же, что от написания i++ вместо ++i выигрыша нет никакого (кроме случаев, когда реально нужен i++).

Но когда отходишь от простых примеров, встает вопрос — где грань? На мой взгляд, чтобы правильно принимать такие решения, нужно хорошо понимать, чем приходится платить за каждый из вариантов. И вот поэтому мне особенно не нравятся конкретные советы по эффективности (типа рассматриваемых) — они не включают объяснения скрытых механизмов.

"Prefer structs to classes whenever you can?" Да вы что? Если мне нужен совет такого рода, то мне вероятно нужно объяснить, когда это - "whenever I can", и почему я могу быть не "can"? Если я не понимаю разницы между классами и структурами, то как я могу определить, когда мне нельзя использовать структуры?

Или вот рекомендация про GetHashCode, которую Сергей обошел вниманием. Она как будто бы разумная, но лучше бы дать ссылку на описание реализации (например такую: https://habrahabr.ru/post/188038/) и упомянуть, что вообще-то написать хороший GetHashCode может быть ни разу не тривиально.
ОтветитьУдалить
Ответы
Unknown30 мая 2016 г. в 10:52
Чтобы критикуемые советы остались полезными и не вызывали недогования, достаточно в каждом пункте заменить "Не используйте! ..." на "Обратите внимание, что ...".
ОтветитьУдалить
Ответы
jack12830 мая 2016 г. в 13:43
>>Например, цикл for в C# работает только с индексируемыми коллекциями
Можно пояснить, что имеется в виду?
У меня такой код вполне работает
for(var enumerator = enumerable.GetEnumerator(); enumerator.MoveNext();)
{
Console.WriteLine(enumerator.Current);
}

И второй пример кривой какой то. В нем вообще убрать walker нужно и тупо вызвать ProccessNode(node).
ОтветитьУдалить
Ответы
Unknown30 мая 2016 г. в 15:37
Да таких советов полн интернет, а джуниоры часто не умеют фильтровать
ОтветитьУдалить
Ответы
eugene31 мая 2016 г. в 09:33
Думаю, что пост был исключительно холивара ради. Ну так - буря в стакане воды. Как по-мне на это никто не поведется вообще. Если же говорить о действительно time critical участках кода, то на мой взгляд надо разговаривать о выборе сборщика мусора и его режиме. В общем, без контекста - это так - пук в воду.
ОтветитьУдалить
Ответы
Nightcoder1 июня 2016 г. в 03:57
Это 3.14пец, товарищи. Таким советчикам надо минимум на год запрещать писать.

>Как по-мне на это никто не поведется вообще.
Уверен, что куча людей поведётся. К сожалению, я сам слышал такие советы от вроде бы опытных разработчиков :(
ОтветитьУдалить
Ответы
Ivan Danilov4 июня 2016 г. в 09:01
Насколько я помню, for быстрее еще и потому, что часто позволяет JIT-у вынести index range checking вне цикла таким образом, что при доступе к каждому элементу они не происходят. Ну и в базовом случае foreach над массивом и List'ом, кажется, генерировал идентичный IL/native code. Для других IEnumerable это не так, конечно.
ОтветитьУдалить
Ответы
Unknown4 июня 2016 г. в 13:15
Этот комментарий был удален автором.
ОтветитьУдалить
Ответы
Unknown4 июня 2016 г. в 13:16
А я вот на счет того, чтобы по возможности избегать Linq соглашусь. Может он и хорош в плане сокращения кода и удобности восприятия для нечастых операций, но во всех случаях что я переписывал Linq на обычные варианты алгоритмов давали прирост производительности от нескольких десятков % до нескольких порядков!!
ОтветитьУдалить
Ответы
Unknown4 июня 2016 г. в 13:21
В случае с foreach. Его я стараюсь так же избегать по возможности. У меня есть собственные реализации Dictionary и других хеш коллекций и когда мне нужно перебрать все элементы, я просто возвращаю массив ключей, значений или пар и перебираю его for-ом. Этот перебор вместе с выборкой и созданием нужного массива отрабатывает в 2-2,5 раза быстрее простого foreach перебора.
ОтветитьУдалить
Ответы
Unknown5 июня 2016 г. в 01:34
Этот комментарий был удален автором.
ОтветитьУдалить
Ответы
Unknown5 июня 2016 г. в 02:19
Пожелание. Внесите пожалуйста возможность редактирования сообщения, а то появляется мысль, а чтоб дополнить приходится удалять и отправлять новый комментарий :).
ОтветитьУдалить
Ответы
Максим6 июня 2016 г. в 05:19
Сергей, поясни пожалуйста, зачем в проблеме #2 нужно вообще использовать делегат, почему нельзя напрямую вызывать ProcessNode?
ОтветитьУдалить
Ответы
Unknown6 июня 2016 г. в 14:36
visit us http://www.stackoverflow.info/
ОтветитьУдалить
Ответы
Ivan Danilov6 июня 2016 г. в 16:52
Ради интереса проверил: разницы между 'ProcessNode' как method group и '(n) => ProcessNode(n)' нет никакой, в обоих случаях компилятор возвращает один и тот же объект.
Тестировал вот так: https://gist.github.com/ivan-danilov/70f09edada47a28d86bab5f35ec6db2b на Розлине, .NET 4.6.1. Release/Debug и наличие или отсутствие дебаггера ничего не меняют.
ЧЯДНТ?
ОтветитьУдалить
Ответы
Unknown18 июня 2016 г. в 08:59
english version please
what is programming
ОтветитьУдалить
Ответы
Shahadot islam10 сентября 2016 г. в 05:59
thanks for sharing.
regars
clipping path services
ОтветитьУдалить
Ответы
Yanira Morrison14 мая 2024 г. в 10:08
This post is a gem. Thank you for brightening our day with your words.

Click Here: Creative photo manipulation
ОтветитьУдалить
Ответы