Библиотека адаптеров для упрощенной работы с алгоритмами, контейнерами и файлами. Обобщенный подход к алгоримам и итераторам позволяет более элегантно решать типовые задачи.
Например, для решения задачи нахождения частотности слов среди всех текстовых файлов директории, код может выглядеть следующим образом:
Dir(argv[1], recursive)
| Filter([](std::filesystem::path& p){ return p.extension() == ".txt"; })
| OpenFiles()
| Split("\n ,.;")
| Transform(
[](std::string& token) {
std::transform(token.begin(), token.end(), token.begin(), [](char c){return std::tolower(c);});
return token;
})
| AggregateByKey(
0uz,
[](const std::string&, size_t& count) { ++count;},
[](const std::string& token) { return token;}
)
| Transform([](const std::pair<std::string, size_t>& stat) { return std::format("{} - {}", stat.first, stat.second);})
| Out(std::cout);
Еще одним значимым отличием такого подхода от классических является то, что вычисления являются могут быть ленивыми, а создаваемые объекты не владеют массивом данных для решения данной задачи. Подобный подход, в частности, применяется в классах std::string_view и std::span
- Dir - берет все файлы в директории (и рекурсивно по всем поддиректориям)
- OpenFiles - открывает файловый поток для каждого пути из предыдущего адаптера
- Split - делит входной поток по списку делимитеров передаваемых через аргументы
- Out - выводит данные в выходной поток
- AsDataFlow - преобразует контейнер в поток данных для дальнейшей обработки
- Transform - изменяет значения элементов, наподобие того как это делает алгоритм transform, применяя заданную функцию к каждому элементу
- Filter - фильтрация по определенному признаку, признак передается в качестве аргумента
- Write - проходится по всем элементам входного диапазона и записать их в указанный поток вывода, вставляя между элементами (а также после каждого элемента) заданный разделитель.
- AsVector - собирает результаты обработки в вектор
- Join - объединяет два потока данных по ключу, аналогично операции LEFT JOIN в SQL
- KV - структура ключ-значение, используемая для операций объединения
- JoinResult - результат операции объединения, содержащий данные из обоих потоков
- DropNullopt - фильтрует
std::optinal<T>
поток отstd::nullopt
значений - SplitExpected - в случае если предыдущий адаптер возвращает expeceted, позволяет разделить пайплайн обработки на 2 для ожидаемых и нет результатов
- AggregateByKey - агрегация значений относительно соответствующего ключа. Значение, соответствующее ключу, обновляется через переданный функциональный объект - агрегатор. Выполняется не лениво
- Пример:
aggregator := [int value{}](char c) { value++; return value; } [ a, b, c, d, a, a, b, d ] -> [ (a, 3), (b, 2), (c,1), (d,2) ]
- Пример:
Требование по памяти ко всем адаптерам кроме AggregateByKey и Join - константа.
Все вышеуказанные сущности были покрыты тестами, с помощью фреймворка Google Test.
При реализации классов, для их использования в range-based for
,был реализован ряд требований.