Ответы пользователя Дмитрий Беляев по тегу «Rust»

Как повторять цикл в дочернем потоке с заданным интервалом для последних актуальных данных?

Дмитрий Беляев @bingo347

Crazy on performance...

Примерно так это можно реализовать:

use chrono::Utc;
use std::{
    io::{self, BufRead as _},
    sync::mpsc::{self, RecvTimeoutError, Sender},
    thread,
    time::{Duration, Instant},
};

enum Op {
    Add(String),
    Del(String),
}

const PRINT_INTERVAL: Duration = Duration::from_secs(10);

fn main() {
    println!("---\n{}\n---\n", Utc::now());

    let (tx, rx) = mpsc::channel();
    start_stdin_thread(tx);

    let mut strings = Vec::new();
    let mut last_print = Instant::now();
    loop {
        match rx.recv_timeout(PRINT_INTERVAL - last_print.elapsed()) {
            Err(RecvTimeoutError::Disconnected) => break,
            Err(RecvTimeoutError::Timeout) => {
                println!("---\n{}\n{:?}\n---\n", Utc::now(), strings);
                last_print = Instant::now();
            }
            Ok(Op::Add(s)) => {
                strings.push(s);
            }
            Ok(Op::Del(s)) => {
                strings.retain(|v| v != &s);
            }
        }
    }
}

fn start_stdin_thread(tx: Sender<Op>) {
    #[derive(Clone, Copy)]
    enum OpRaw {
        Add,
        Del,
    }

    thread::spawn(move || {
        let mut stdin = io::stdin().lock();
        let mut buf = String::with_capacity(1024);
        let mut read_line = |buf: &mut String| -> io::Result<()> {
            buf.clear();
            stdin.read_line(buf).map(|_| ()).inspect_err(|err| {
                eprintln!("Ошибка чтения stdin: {err}");
            })
        };

        loop {
            println!("1. Добавить текст");
            println!("2. Удалить текст");
            print!("Введите номер операции: ");
            if read_line(&mut buf).is_err() {
                break;
            }

            let op = match buf.trim() {
                "1" => OpRaw::Add,
                "2" => OpRaw::Del,
                _ => {
                    eprintln!("Некорректная операция");
                    continue;
                }
            };

            println!(
                "Введите текст на {}:",
                match op {
                    OpRaw::Add => "добавление",
                    OpRaw::Del => "удаление",
                }
            );
            if read_line(&mut buf).is_err() {
                break;
            }

            let text = buf.trim().to_string();
            let op = match op {
                OpRaw::Add => Op::Add(text),
                OpRaw::Del => Op::Del(text),
            };

            if tx.send(op).is_err() {
                break;
            }
        }
    });
}

Ответ написан 25 июл.

1 комментарий

Как поправить код для отдельного потока, чтобы обрабатывать данные по заданному времени?

Дмитрий Беляев @bingo347

Crazy on performance...

Во-первых, следует понять, что канал по своей природе - это очередь.
То есть, если пользователь успеет за отведённое время сделать 5 изменений, то наш дочерний поток получит 5 копий вектора, а судя по задаче там ожидается только актуальная последняя копия.
Гораздо логичнее просто пошарить между потоками единственный вектор обёрнутый в Arc<RwLock<...>> или Arc<Mutex<...>>, заодно и памяти меньше сожрём и не будем греть проц бесполезными аллокациями памяти и копированием вектора.

Но если всё же задача другая, то у Receiver канала помимо метода recv, который блокирует поток до получения сообщения, есть ещё методы try_recv (не блокирует поток вообще) и recv_timeout (блокирует, но не дольше переданного таймаута).
https://doc.rust-lang.org/std/sync/mpsc/struct.Rec...
https://doc.rust-lang.org/std/sync/mpsc/struct.Rec...

P.S.

Duration::from_millis(10)

тут явно не 10 секунд...

P.S.S. Перформанс сия кода ушёл в отставку:
В коде есть лишние итерации по вектору.
В коде куча лишних аллокаций и копирования памяти.
Всю задачу можно вообще решить на одном потоке и оно будет работать быстрее ибо про синк кэшей проца тоже не надо забывать.

Ну и так по мелочи:

if console.0 == 1 {
    h_add_del_txt.insert(1, console.1);
} else if console.0 == 2 {
     h_add_del_txt.insert(2, console.1);
} else {  
     // ...
}

match, enum вместо u8

et mut g = String::new();
     io::stdin().read_line(&mut g).expect("Failed to read line");
     let g: String = g.trim().parse().expect("Please type a ...");

WTF?

Ну и паниковать на каждый чих так себе идея...

Ответ написан 24 июл.

1 комментарий

В каких случая стоит использовать usize?

Дмитрий Беляев @bingo347

Crazy on performance...

Для операций сводящихся к арифметике указателей.
Помимо непосредственно арифметики указателей сюда относятся индексация и длина слайсов/массивов/векторов/строк, capacity вектора/строки, размеры и выравнивание типов, смещение полей относительно начала структуры.
Но в целом, где удобно, там и используйте, никто не запрещает использовать usize/isize как и другие int типы

Ответ написан 10 апр.

2 комментария

Как проверить перемещается ли в памяти объект при "перемещении"?

Дмитрий Беляев @bingo347

Crazy on performance...

При перемещении адрес на стеке изменится, а адрес памяти выделенной на куче - нет.
Тут очень тонкий момент, который нужно понимать, данные которые мы помещаем в Box или Vec будут размещены на куче, но сами Box и Vec - это такие же структуры, как и любые другие, просто на них есть некоторая логика для управления памятью на куче, в случае 64 битной архитектуры и T: Sized, Box<T> будет занимать 8 байт на стеке и размер T на куче, а Vec<T> - 24 байта на стеке (указатель на начало, длина и фактически выделенная память) и размер T умноженный на capacity на куче.

fn main() {
    let a = Box::new(42);
    println!("Stack address of a: {:p}", &a);
    println!("Heap address of a: {:p}", &*a);
    
    let b = a;
    println!("Stack address of b: {:p}", &b);
    println!("Heap address of b: {:p}", &*b);
}

Stack address of a: 0x7fff59586010
Heap address of a: 0x58cf76717b10
Stack address of b: 0x7fff59586018
Heap address of b: 0x58cf76717b10

Ответ написан 09 апр.

Комментировать

Rust как подключить внешний файл в модуле?

Дмитрий Беляев @bingo347

Crazy on performance...

Структура модулей в крейте с точностью повторяет структуру файлов на диске, даже если модуль объявлен внутри модуля не вынесеного в отдельный файл.
То есть одно и то же объявление mod db;будет искать файл в разных местах, в зависимости от того, где оно написано:

если написать в корне src/lib.rs то будет искать src/db.rs или src/db/mod.rs
если написать в модуле cmd внутри src/lib.rs то будет искать src/cmd/db.rs или src/cmd/db/mod.rs

Но у меня большое подозрение, что Вы вообще не понимаете, как работает ключевое слово mod, ибо напихали его где только можно, включая сам db.rs (там будет искать src/db/db.rs кстати). Ключевое слово mod подключает модуль как дочерний того модуля, где оно написано. А для импорта имён нужно использовать use.

И как верно подметил fenrir, если бы Вы внимательно прочитали растбук, то Вы бы это поняли.

Ответ написан 29 мар.

3 комментария

Как в код сервера axum внести счётчик ответов на запросы клиента из браузера?

Дмитрий Беляев @bingo347

Crazy on performance...

https://doc.rust-lang.org/std/sync/atomic/struct.A...

use std::sync::atomic::{AtomicU32, Ordering};

async fn create_user(
    Json(payload): Json<FromBrowser>,
 ) -> (StatusCode, Json<User>) {
    static COUNTER: AtomicU32 = AtomicU32::new(0);

    // подготавливаю данные на отправку в браузер:
    let user = User {
       id: payload.id,
       username: payload.username,
       tm: payload.tm,
       cnt: COUNTER.fetch_add(1, Ordering::SeqCst),   // считаю отправки; 
    };

    (StatusCode::CREATED, Json(user))
 }

Ответ написан 28 нояб. 2024

1 комментарий

Слайс на неинициализированную память?

Дмитрий Беляев @bingo347

Crazy on performance...

MaybeUninit под капотом - это union, то есть компилятор ничего не знает, инициализированное там значение или нет и перекладывает эту ответственность на программиста. А значит UB здесь не будет.
То есть спокойно делаете &mut [MaybeUninit<*mut State>], инициализируете элементы и после std::mem::transmute в &mut [*mut State]

Ответ написан 12 нояб. 2024

2 комментария

Возможно ли собрать данные из итератора в уже созданный буфер?

Дмитрий Беляев @bingo347

Crazy on performance...

let arr: [i32; 10] = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10];
let mut arr2: [i32; 10] = [0; 10];

arr.iter()
    .zip(arr2.iter_mut())
    .filter(|(el, _)| **el % 2 == 0)
    .for_each(|(el, target)| {
        *target = *el;
    });

Ответ написан 28 сент. 2024

Комментировать

Как исправить ошибку error: linking with `link.exe` failed: exit code: 1120?

Дмитрий Беляев @bingo347

Crazy on performance...

Попробуйте добавить build скрипт (файл build.rs на том же уровне где Cargo.toml) со следующим содержимым:

fn main() {
    println!("cargo:rustc-link-lib=dylib=Gdi32.dll");
}

Ответ написан 19 сент. 2024

4 комментария

Почему не работает прокси?

Дмитрий Беляев @bingo347

Crazy on performance...

Вот по Вашей же ссылке на доку:

https://docs.rs/reqwest/latest/reqwest/struct.Prox...

Proxy all HTTP traffic to the passed URL.

Проксирует весь HTTP трафик

https://docs.rs/reqwest/latest/reqwest/struct.Prox...

Proxy all HTTPS traffic to the passed URL.

Проксирует весь HTTPS трафик

https://docs.rs/reqwest/latest/reqwest/struct.Prox...

Proxy all traffic to the passed URL.

Пооксирует вообще весь трафик

Ответ написан 12 сент. 2024

Комментировать

FnMut в немутабельной переменной?

Дмитрий Беляев @bingo347

Crazy on performance...

Мутабельность нужна для вызова, так как FnMut вызывается по мутабельной ссылке.
Здесь же только передаётся владение в метод run

P.S. что-то мне подсказывает, что сигнатура не совсем корректная. Отсутствует объявление дженерика T (и возможно его ограничений), отсутствует лайфтайм для ссылки в колбэке:

pub fn run<T, F>(self, event_handler: F) -> Result<(), EventLoopError>
    where
        F: for<'a> FnMut(Event<T>, &'a EventLoopWindowTarget<T>),
{
    self.event_loop.run(event_handler)
}

Ответ написан 06 сент. 2024

Комментировать

Каких вещей следует избегать в Rust?

Дмитрий Беляев @bingo347

Crazy on performance...

Я знаю, что следует избегать всяких "продвинутых" штук из ряда связных списков, самореферентных структур и т.п.

Односвязные списки никаких проблем не доставляют (ну кроме того, что они плохо ложатся на процессорный кэш). Для двусвязных списков и самореферентных структур придётся использовать сырые указатели и unsafe.

Ещё я обнаружил, что создание больших структур, с методами, с кучей полей, обычно приводит к проблемам с borrow checker.

Borrow checker абсолютно плевать на размер структур. Это никак не связано.

А если в структуре будет ссылка или иное заимствование, то это гарантированные проблемы.

Нет ни каких проблем.

Насколько я понимаю, самым рабочим выглядит чисто функциональный подход, а не структур с методами.

Одно другому никак не противоречит.

И правильно ли я понимаю, что следует избегать структур хранящих ссылки и имеющими лайфтайм?

Не правильно.

Так, наличие в умеренных размерах программе, которая по сути была одной функцией, лишь одной структуры хранящей ссылку, поставило крест на попытке структуризации программы в более человеческий вид.

Что-то делаете не так. Без конкретных примеров кода сказать сложно.

И очень часто в Rust программах, мне приходится идти на более уродливую архитектуру, дабы избежать проблем с (почти ненужным в однопоточном коде) borrow checker.

Что-то делаете не так. Скорее всего просто не понимаете borrow checker и пытаетесь писать на новом языке так, как привыкли в каком-то другом.

И в вопросе о borrow checker, разве не является тот факт, что большинство библиотек избегает &mut self в изменяющих что-то методах, звоночком к наличию большим проблем в языке?

О каком большинстве речь? Библиотеки используют мутабельные ссылки там где это нужно. Если метод действительно что-то меняет, то будет мутабельная ссылка ну и иногда будет использоваться interior mutability там где это необходимо. В языке нет проблем с мутабельными ссылками.

В общем, посоветуйте что-то что-бы помогало меньше бороться с borrow checker, потому что сейчас я очень много времени трачу именно на это.

Для начала понять его. Понять какую проблему он решает. Почитайте, что такое undefined behavior. Почитайте, что такое алиасинг.

Возможно где-то альтернативой мутабельным ссылкам будут Cell/RefCell в однопоточном коде и Mutex/RwLock в многопоточном.
Возможно если покажете примеры кода, где у Вас проблемы, то можно будет подсказать что-то более конкретное.

Ответ написан 05 сент. 2024

3 комментария

Возможно ли выполнить JavaScript код в Rust при помощи NodeJS?

Дмитрий Беляев @bingo347 Куратор тега JavaScript

Crazy on performance...

Хоть и вопрос несколько сумбурный и не совсем понятно, что автор хочет на самом деле...
Но краткий ответ: да, возможно, но есть нюансы...

Самый простой вариант - запускать node как отдельный процесс. Можно просто запускать на каждый чих, а можно заморочиться и организовать общение между приложением на Rust и приложением на Node.js

Вариант поинтереснее - Node.js можно собрать как библиотеку (есть даже готовые бинарные сборки такого), линкуем с приложением на Rust. Всё живёт в одном процессе, но node будет запускать свои потоки.

Есть и обратный последнему вариант. Можно из Rust кода собрать бинарный аддон к Node.js
Правда тут уже JS код будет запускать код на Rust.
https://napi.rs
https://neon-rs.dev

Можно пойти дальше. Если задача просто исполнять JS код из приложения на Rust, то можно слинковаться с одним из JS движков. Приколюх предоставляемых платформой Node.js здесь не будет (вроде fs или http), хотя никто не мешает реализовать это самостоятельно.
https://crates.io/crates/v8
https://crates.io/crates/quickjs_runtime

Ответ написан более года назад

3 комментария

Как реализовать превращение вектора объектов в дерево?

Дмитрий Беляев @bingo347

Crazy on performance...

Главная проблема тут - лайфтаймы. В частности у переменной на стеке никогда не будет лайфтайма 'static.
Ну и отдавать в куда либо долгоживущее ссылку на временное значение - UB. Благо лайфтаймы и тут спасают.
Собственно для этого Rc и нужен - он владеющая ссылка. Соответственно в нём должно быть значение, а не ссылка (ссылка на ссылку редко когда нужна).

use std::cell::RefCell;
use std::rc::Rc;

#[derive(Default, Clone, Debug)]
struct NodeInner {
    name: String,
    source: String,

    path: String,
    leaf: bool,
    children: Vec<Node>,
}

#[derive(Default, Clone, Debug)]
struct Node(Rc<RefCell<NodeInner>>);

impl Node {
    fn fast(name: impl Into<String>, source: impl Into<String>) -> Self {
        Self(Rc::new(RefCell::new(NodeInner {
            name: name.into(),
            source: source.into(),

            path: String::new(),
            leaf: true,
            children: Vec::new(),
        })))
    }

    fn insert(&self, node: Node) {
        let mut current = self.clone();
        for part in node.0.borrow().source.split(".") {
            let inner = node.0.borrow();
            let found = inner.children.iter().find(|&v| v.0.borrow().path == part);

            match found {
                None => {
                    let tmp = Node::fast(String::new(), String::new());
                    current.0.borrow_mut().children.push(tmp.clone());
                    current = tmp;
                }
                Some(val) => current = val.clone(),
            }
        }
    }
}

fn main() {
    let mut root = Node::default();
    root.insert(Node::fast("First", "e"));
    root.insert(Node::fast("First", "e.sources"));
    root.insert(Node::fast("First", "e.sources.two"));
    root.insert(Node::fast("First", "e.secret"));
    root.insert(Node::fast("First", "e.secret.left"));
    root.insert(Node::fast("First", "e.secret.right"));
    print!("{:#?}", root);
}

Как заполнять поля уже сами разбирайтесь, думаю тут не сложно

Ответ написан более года назад

3 комментария

Вызов функций С++ из .h?

Дмитрий Беляев @bingo347

Crazy on performance...

Скорее всего придётся сделать extern C обёртку над библиотекой и биндится уже с ней. Ну и надо понимать, что никакие абстракции плюсов вроде темплейтов, классов и т.д. в раст не протащить.

В какой-то степени может помочь cxx, но надо понимать, что эта штука тоже не всесильна.

Ответ написан более года назад

15 комментариев

Почему время жизни параметров берутся из дженериков?

Дмитрий Беляев @bingo347

Crazy on performance...

Советую почитать вот эту статью: https://habr.com/ru/articles/515034/

А вообще, времена жизни - это часть типа.
Условный u32 имеет время жизни 'static
А ссылка на u32 - &'a u32 (где 'a это диапазон от объявления исходного u32 до его последнего использования) будет иметь время жизни 'a
Пример по сложнее, ссылка на ссылку - &'a &'b u32 - будет иметь время жизни наименьшее из 'a и 'b

Передаётся через дженерик, так как функция должна работать с абстрактным временем жизни

fn example<'a>(r: &'a u32) -> &'a u32 { r }

fn f_a() {
    let a = 1;
    let r = example(&a);
}

fn f_b() {
    let b = 1;
    let r = example(&b);
}

В этом примере очевидно что переменная a в f_a будет иметь время жизни отличное от b в f_b, но example спокойно работает и с тем и с другим, то есть она является обобщённой по времени жизни, в первом случае она вернёт ссылку с временем жизни как у переменной a, во втором - как у b.

А ещё помимо времен жизни и типов в дженериках могут быть некоторые константы:

fn make_array<const SIZE: usize>(el: u32) -> [u32; SIZE] {
    [el; SIZE]
}

let arr = make_array::<3>(1); // [1, 1, 1]

Ответ написан более года назад

3 комментария

Что делает метод as_bytes?

Дмитрий Беляев @bingo347

Crazy on performance...

Представление структуры в памяти в виде байтов

Ответ написан более года назад

8 комментариев

Вызов drop в вызове drop?

Дмитрий Беляев @bingo347

Crazy on performance...

Почему drop принимает ссылку, а не значение?

Потому что метод drop трейта Drop вызывается компилятором, каждый раз когда переменная владеющая чем-либо выходит из области видимости. И сам метод drop тут не исключение. То есть если бы self тут был по значению, компилятор был бы обязан его дропнуть в конце функции, что вызвало бы бесконечную рекурсию.

Причём если вызывать drop() руками

Функция core::mem::drop никакого отношения к трейту Drop не имеет. Если Вы глянете на её реализацию, то это просто пустая функция, которая принимает аргумент по значению, а он уже дропается на общих основаниях, так как выходит из области видимости в ней.

Почему сначала вызывается drop для A, а потом для B? По логике drop должен сначала вызываться для полей.

У Вас неверная логика. В метод трейта Drop приходит ссылка, а значит должна быть гарантия того что данные по ней полностью валидные. Всегда дропается сначала внешняя структура,а затем её поля. Более того компилятор не даст Вам даже мувнуть части структуры имплиментирующей Drop.

Если очень нужно, то владение из поля можно забрать через std::mem::swap/std::mem::replace/std::mem::take
Хотя проще это сделать обернув такое поле в Option и забирая владение его методом take

Ответ написан более года назад

2 комментария

Как написать такой макрос?

Дмитрий Беляев @bingo347

Crazy on performance...

Я бы тут не парился, и превращал бы это:

#[r]
fn bar(a: usize) -> usize {
    if a % 2 == 0 {
        return 0;
    }
    1
}

В это:

fn bar(a: usize, res: *mut usize) {
    fn bar_impl(a: usize) -> usize {
        if a % 2 == 0 {
            return 0;
        }
        1
    }
    unsafe { *res = bar_impl(a); }
}

Главная фишка в том, что исходный код оставляем без изменений, парсить надо только сигнатуру (что с использованием syn - легко).
По сути просто генерируем обёртку. Для универсальности стоит учесть async fn.

Ну и если совсем по хорошему, то тут легко UB поймать с сырым указателем, и генерируемую функцию имеет смысл делать unsafe.

Ответ написан более года назад

Комментировать

Возврат собственного типа ошибки из main с печатью сообщения об ошибке?

Дмитрий Беляев @bingo347

Crazy on performance...

fn main() -> MainResultWrapper {
    MainResultWrapper(main_inner())
}

#[inline(always)]
fn main_inner() -> Result<(), GlobalError> {
    let config = read_config_from_file()?;
    Ok(())
}

Ответ написан более года назад

Комментировать

Войдите на сайт