Ответы, понравившиеся пользователю TicSo

Как повторять цикл в дочернем потоке с заданным интервалом для последних актуальных данных?

Дмитрий Беляев @bingo347

Crazy on performance...

Примерно так это можно реализовать:

use chrono::Utc;
use std::{
    io::{self, BufRead as _},
    sync::mpsc::{self, RecvTimeoutError, Sender},
    thread,
    time::{Duration, Instant},
};

enum Op {
    Add(String),
    Del(String),
}

const PRINT_INTERVAL: Duration = Duration::from_secs(10);

fn main() {
    println!("---\n{}\n---\n", Utc::now());

    let (tx, rx) = mpsc::channel();
    start_stdin_thread(tx);

    let mut strings = Vec::new();
    let mut last_print = Instant::now();
    loop {
        match rx.recv_timeout(PRINT_INTERVAL - last_print.elapsed()) {
            Err(RecvTimeoutError::Disconnected) => break,
            Err(RecvTimeoutError::Timeout) => {
                println!("---\n{}\n{:?}\n---\n", Utc::now(), strings);
                last_print = Instant::now();
            }
            Ok(Op::Add(s)) => {
                strings.push(s);
            }
            Ok(Op::Del(s)) => {
                strings.retain(|v| v != &s);
            }
        }
    }
}

fn start_stdin_thread(tx: Sender<Op>) {
    #[derive(Clone, Copy)]
    enum OpRaw {
        Add,
        Del,
    }

    thread::spawn(move || {
        let mut stdin = io::stdin().lock();
        let mut buf = String::with_capacity(1024);
        let mut read_line = |buf: &mut String| -> io::Result<()> {
            buf.clear();
            stdin.read_line(buf).map(|_| ()).inspect_err(|err| {
                eprintln!("Ошибка чтения stdin: {err}");
            })
        };

        loop {
            println!("1. Добавить текст");
            println!("2. Удалить текст");
            print!("Введите номер операции: ");
            if read_line(&mut buf).is_err() {
                break;
            }

            let op = match buf.trim() {
                "1" => OpRaw::Add,
                "2" => OpRaw::Del,
                _ => {
                    eprintln!("Некорректная операция");
                    continue;
                }
            };

            println!(
                "Введите текст на {}:",
                match op {
                    OpRaw::Add => "добавление",
                    OpRaw::Del => "удаление",
                }
            );
            if read_line(&mut buf).is_err() {
                break;
            }

            let text = buf.trim().to_string();
            let op = match op {
                OpRaw::Add => Op::Add(text),
                OpRaw::Del => Op::Del(text),
            };

            if tx.send(op).is_err() {
                break;
            }
        }
    });
}

Ответ написан 25 июл.

1 комментарий

Как поправить код для отдельного потока, чтобы обрабатывать данные по заданному времени?

Дмитрий Беляев @bingo347

Crazy on performance...

Во-первых, следует понять, что канал по своей природе - это очередь.
То есть, если пользователь успеет за отведённое время сделать 5 изменений, то наш дочерний поток получит 5 копий вектора, а судя по задаче там ожидается только актуальная последняя копия.
Гораздо логичнее просто пошарить между потоками единственный вектор обёрнутый в Arc<RwLock<...>> или Arc<Mutex<...>>, заодно и памяти меньше сожрём и не будем греть проц бесполезными аллокациями памяти и копированием вектора.

Но если всё же задача другая, то у Receiver канала помимо метода recv, который блокирует поток до получения сообщения, есть ещё методы try_recv (не блокирует поток вообще) и recv_timeout (блокирует, но не дольше переданного таймаута).
https://doc.rust-lang.org/std/sync/mpsc/struct.Rec...
https://doc.rust-lang.org/std/sync/mpsc/struct.Rec...

P.S.

Duration::from_millis(10)

тут явно не 10 секунд...

P.S.S. Перформанс сия кода ушёл в отставку:
В коде есть лишние итерации по вектору.
В коде куча лишних аллокаций и копирования памяти.
Всю задачу можно вообще решить на одном потоке и оно будет работать быстрее ибо про синк кэшей проца тоже не надо забывать.

Ну и так по мелочи:

if console.0 == 1 {
    h_add_del_txt.insert(1, console.1);
} else if console.0 == 2 {
     h_add_del_txt.insert(2, console.1);
} else {  
     // ...
}

match, enum вместо u8

et mut g = String::new();
     io::stdin().read_line(&mut g).expect("Failed to read line");
     let g: String = g.trim().parse().expect("Please type a ...");

WTF?

Ну и паниковать на каждый чих так себе идея...

Ответ написан 24 июл.

1 комментарий

Как внести данные из приложения AXUM в вектор?

Василий Банников @vabka Куратор тега Rust

Кажется, ты просто в своих же типах запутался. Всё работает (ниже работающий код)

Подскажите, пожалуйста, как исправить код и есть ли разные решения с точки зрения скорости работы для случаев:
- такой вектор только читают
- вектор читают и изменяют.

Если только читают, то 1 раз его проинициализировал, а в стейте пусть лежит Arc без mutex.
Если и читают и пишут, то RwLock, но стоит подумать над структурами данных, тк у тебя ради добавления одной записи блокируется весь список. Что-нибудь на основе связных списков например позволит не блочить весь вектор.

use axum::extract::State;
use axum::http::StatusCode;
use axum::routing::{get, post};
use axum::{Json, Router};
use serde::{Deserialize, Serialize};
use std::sync::{Arc, Mutex};

#[derive(Debug, Clone)]
struct AppState {
    d: Arc<Mutex<Vec<String>>>,
}

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let state = AppState {
        d: Arc::new(Mutex::new(vec![])),
    };

    let app = Router::new()
        .route("/info", post(create_user))
        .route("/list_users", get(list_users))
        .with_state(state);

    let listener = tokio::net::TcpListener::bind("127.0.0.1:3000")
        .await
        .unwrap();
    axum::serve(listener, app).await.unwrap();

    Ok(())
}

#[derive(Deserialize)]
pub struct FromBrowser {
    username: String,
}

#[derive(Serialize)]
pub struct User {
    username: String,
}

async fn create_user(
    State(state): State<AppState>,
    Json(payload): Json<FromBrowser>,
) -> (StatusCode, Json<User>) {
    // ...
    let user = User {
        username: payload.username,
    };

    {
        let mut d = state.d.lock().expect("mutex was poisoned");
        d.push(user.username.to_owned());
    }
    println!("state = {:?}", state);
    (StatusCode::CREATED, Json(user))
}

async fn list_users(State(state): State<AppState>) -> (StatusCode, Json<Vec<String>>) {
    let users = state.d.lock().expect("mutex was poisoned").clone();
    (StatusCode::OK, Json(users))
}

Ответ написан 16 дек. 2024

1 комментарий

Возможно ли собрать данные из итератора в уже созданный буфер?

Дмитрий Беляев @bingo347

Crazy on performance...

let arr: [i32; 10] = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10];
let mut arr2: [i32; 10] = [0; 10];

arr.iter()
    .zip(arr2.iter_mut())
    .filter(|(el, _)| **el % 2 == 0)
    .for_each(|(el, target)| {
        *target = *el;
    });

Ответ написан 28 сент. 2024

Комментировать

Каких вещей следует избегать в Rust?

Дмитрий Беляев @bingo347

Crazy on performance...

Я знаю, что следует избегать всяких "продвинутых" штук из ряда связных списков, самореферентных структур и т.п.

Односвязные списки никаких проблем не доставляют (ну кроме того, что они плохо ложатся на процессорный кэш). Для двусвязных списков и самореферентных структур придётся использовать сырые указатели и unsafe.

Ещё я обнаружил, что создание больших структур, с методами, с кучей полей, обычно приводит к проблемам с borrow checker.

Borrow checker абсолютно плевать на размер структур. Это никак не связано.

А если в структуре будет ссылка или иное заимствование, то это гарантированные проблемы.

Нет ни каких проблем.

Насколько я понимаю, самым рабочим выглядит чисто функциональный подход, а не структур с методами.

Одно другому никак не противоречит.

И правильно ли я понимаю, что следует избегать структур хранящих ссылки и имеющими лайфтайм?

Не правильно.

Так, наличие в умеренных размерах программе, которая по сути была одной функцией, лишь одной структуры хранящей ссылку, поставило крест на попытке структуризации программы в более человеческий вид.

Что-то делаете не так. Без конкретных примеров кода сказать сложно.

И очень часто в Rust программах, мне приходится идти на более уродливую архитектуру, дабы избежать проблем с (почти ненужным в однопоточном коде) borrow checker.

Что-то делаете не так. Скорее всего просто не понимаете borrow checker и пытаетесь писать на новом языке так, как привыкли в каком-то другом.

И в вопросе о borrow checker, разве не является тот факт, что большинство библиотек избегает &mut self в изменяющих что-то методах, звоночком к наличию большим проблем в языке?

О каком большинстве речь? Библиотеки используют мутабельные ссылки там где это нужно. Если метод действительно что-то меняет, то будет мутабельная ссылка ну и иногда будет использоваться interior mutability там где это необходимо. В языке нет проблем с мутабельными ссылками.

В общем, посоветуйте что-то что-бы помогало меньше бороться с borrow checker, потому что сейчас я очень много времени трачу именно на это.

Для начала понять его. Понять какую проблему он решает. Почитайте, что такое undefined behavior. Почитайте, что такое алиасинг.

Возможно где-то альтернативой мутабельным ссылкам будут Cell/RefCell в однопоточном коде и Mutex/RwLock в многопоточном.
Возможно если покажете примеры кода, где у Вас проблемы, то можно будет подсказать что-то более конкретное.

Ответ написан 05 сент. 2024

3 комментария

Почему время жизни параметров берутся из дженериков?

Дмитрий Беляев @bingo347

Crazy on performance...

Советую почитать вот эту статью: https://habr.com/ru/articles/515034/

А вообще, времена жизни - это часть типа.
Условный u32 имеет время жизни 'static
А ссылка на u32 - &'a u32 (где 'a это диапазон от объявления исходного u32 до его последнего использования) будет иметь время жизни 'a
Пример по сложнее, ссылка на ссылку - &'a &'b u32 - будет иметь время жизни наименьшее из 'a и 'b

Передаётся через дженерик, так как функция должна работать с абстрактным временем жизни

fn example<'a>(r: &'a u32) -> &'a u32 { r }

fn f_a() {
    let a = 1;
    let r = example(&a);
}

fn f_b() {
    let b = 1;
    let r = example(&b);
}

В этом примере очевидно что переменная a в f_a будет иметь время жизни отличное от b в f_b, но example спокойно работает и с тем и с другим, то есть она является обобщённой по времени жизни, в первом случае она вернёт ссылку с временем жизни как у переменной a, во втором - как у b.

А ещё помимо времен жизни и типов в дженериках могут быть некоторые константы:

fn make_array<const SIZE: usize>(el: u32) -> [u32; SIZE] {
    [el; SIZE]
}

let arr = make_array::<3>(1); // [1, 1, 1]

Ответ написан более года назад

3 комментария

Как в код сервера axum внести счётчик ответов на запросы клиента из браузера?

Дмитрий Беляев @bingo347

Crazy on performance...

https://doc.rust-lang.org/std/sync/atomic/struct.A...

use std::sync::atomic::{AtomicU32, Ordering};

async fn create_user(
    Json(payload): Json<FromBrowser>,
 ) -> (StatusCode, Json<User>) {
    static COUNTER: AtomicU32 = AtomicU32::new(0);

    // подготавливаю данные на отправку в браузер:
    let user = User {
       id: payload.id,
       username: payload.username,
       tm: payload.tm,
       cnt: COUNTER.fetch_add(1, Ordering::SeqCst),   // считаю отправки; 
    };

    (StatusCode::CREATED, Json(user))
 }

Ответ написан 28 нояб. 2024

1 комментарий

Как удалить таблицу из базы postgresql, подставляя имя из переменной?

Василий Банников @vabka Куратор тега Rust

Имя таблицы как параметр нельзя передать.
Используй format! или concat!

Ответ написан 22 нояб. 2024

3 комментария

Как сделать много вставок в HashMap за минимальное время?

Дмитрий Беляев @bingo347

Crazy on performance...

Начну с того, что Вы абсолютно не понимаете зачем нужен async. Есть 2 вида нагрузки - CPU-bound и I/O-bound (где I/O - это input/output). Особенность I/O-bound нагрузки в том, что процессор большую часть времени простаивает в ожидании I/O операций (диска, сети, базы данных и т.д.). Async как раз решает эту задачу за счет кооперативной многозадачности, пока одна задача ждет ответ от I/O мы можем нагрузить CPU другой задачей. Естественно все это не бесплатно, но выигрыш тут в отсутствии простоя CPU за счет того, что мы запускаем тысячи задач на небольшом количестве потоков (в некоторых средах, вроде node.js или asyncio в python такой поток вообще 1), например tokio по-умолчанию запускает пул потоков по количеству ядер.
Из этого уже можно выделить проблемы в Вашем коде:

#[tokio::main(flavor = "multi_thread", worker_threads = 1024)]

1024 - потеряли весь профит от небольшого числа потоков, теперь ОС будет распределять 1024 потока на небольшое количество ядер CPU.

async fn set(&mut self, name: String, value: String) {
    self.data.insert(name, value);
}

у этого метода нет ни одной причины быть асинхронным, операции с HashMap - чистый CPU-bound.

Вообще, данную задачу можно распараллелить, и для этого достаточно обычных потоков:

fn main() {
    let start = Instant::now();
    let handles: Vec<_> = (0..4)
        .map(|table_index| {
            std::thread::spawn(move || {
                let mut table = Table::new();
                for i in (0..3000000).filter(|i| (i % 4 + 1) == table_index) {
                    table.set(format!("{}", i), format!("value{}", i));
                }
                table
            })
        })
        .collect();
    for handle in handles {
        let _table = handle.join().unwrap();
        // тут добавляем таблицы в менеджер
    }
    let elapsed = start.elapsed();

    println!("Time taken to set 3,000,000 keys: {:?}", elapsed);
}

и даже это можно заморочиться и улучшить, например запускать потоков не больше std::thread::available_parallelism() или оптимизировать счетчик для каждой таблицы (

(0..3000000).filter(|i| (i % 4 + 1) == table_index)

), но это я оставлю Вам в качестве д/з.

В общем, Ваша проблема не в том, что какие-то структуры/библиотеки медленные, а в том, что Вы их используете не по назначению.

Ответ написан более двух лет назад

2 комментария

Как пояснить работу с типом &str?

Василий Банников @vabka Куратор тега Rust

Для конкатенации строк нужно одно из двух:
1. Одна из строк должна быть String, а не &str и тогда ты просто добавляешь к ней вторую
2. Ты должнен в процессе конкатенации создавать новый String.

А второй вариант у тебя не работает из-за того что ты дропаешь String, который был создан при конкатенации.

Первый вариант имхо не очень читабельный получился. Лучше попробуй вот так:

fn main() {
    let a = "x";
    println!("1. {:?}", a);   // "x"

    let b = format!("{}y", a);
    println!("2. {:?}", b);    // "xy"
}

Либо:

fn main() {
    let mut s = "x".to_string();
    println!("1. {}", s);   // "x"
    s += "y";
    println!("2. {}", s);   // "xy"
}

Ответ написан более года назад

6 комментариев

Как внести в массив символы, которым соответствует диапазон u8?

Roman K @deliro

use std::slice;

fn main() {
    let range = (0..u8::MAX).collect::<Vec<_>>();
    let v = range
        .iter()
        .map(|x| std::str::from_utf8(slice::from_ref(x)).unwrap_or("Err"))
        .collect::<Vec<_>>();
    println!("{v:?}")
}

Ответ написан более года назад

1 комментарий

Как внести в массив символы, которым соответствует диапазон u8?

Дмитрий Беляев @bingo347

Crazy on performance...

fn main() {
    let src: Vec<[u8; 1]> = (0..u8::MAX).map(|i| [i]).collect();
    let mut info =  Vec::<&str>::with_capacity(u8::MAX.into());
    for u in &src {
        let t = std::str::from_utf8(&*u).unwrap_or("Err");
        info.push(t);
    }
    println!("\n{:#?}", info);
}

но надо понимать, что info будет связан лайфтаймом с src, чтоб избавится от этого нужно хранить в нём не &str а String или Box<str>

fn main() {
    let info: Vec<Box<str>> = (0..u8::MAX).map(|i| {
        let u = [i];
        let t = std::str::from_utf8(&u).unwrap_or("Err");
        t.into()
    }).collect();
    println!("\n{:#?}", info);
}

Ответ написан более года назад

1 комментарий

Как исправить код конвертации vec_u8 to vec_&str?

Дмитрий Беляев @bingo347

Crazy on performance...

Сумбурный вопрос, но если правильно понял, то автор хочет получить Vec<&str> элементы которого ссылаются на исходный вектор байт и в каждом элементе строка из 1 символа:

let u01 = vec![59, 13, 10, 32, 47, 42];
let u01_str = std::str::from_utf8(&u01).expect("invalid utf8");
let mut u02 = Vec::with_capacity(u01.len());
let mut i0 = 0;
for (i, _) in u01_str.char_indices().skip(1) {
    u02.push(&u01_str[i0..i]);
    i0 = i;
}
u02.push(&u01_str[i0..]);
println!("u02 = {:?}", u02);

Ответ написан более года назад

Комментировать

В чем отличие ngnix от golang?

Ипатьев @ipatiev

Потомок старинного рода Ипатьевых-Колотитьевых

На самом деле эта путаница по-человечески очень понятна и объяснима.
Вы, как фронтендер, воспринимаете "веб-сервер" как такой черный ящик, "то место, откуда фронт запрашивает данные".

В то время как этот термин может означать несколько разных понятий.
1. Веб-сервер в вашем, широком понимании. Бэкенд целиком.
2. Также веб-сервером может называться и сам компьютер, на котором все это крутится.
3. В более узком смысле - это программа, которая принимает НТТР запросы. Вот это nginx и есть. Но сам по себе, без помощи других программ, он не может полностью представлять услуги веб-сервера. Например, в нем нет базы данных. Это, скорее, как правильно написали в соседнем ответе - такой прокси-сервер, который частично обрабатывает запросы сам (например к статическим файлам), а частично - проксирует запросы на другие программы.

И вот на Го (или РНР, Питоне, JS, C#) как раз и пишется эта программа, которая, к примеру, обращается в БД, получает нужные данные и отдает их Nginx-у, который уже и возвращает их клиенту

Ответ написан более года назад

14 комментариев

Как передать из функции значения в разные потоки?

Дмитрий Беляев @bingo347

Crazy on performance...

Начну с того, что код представленный автором в комментах к вопросу имеет deadlock между мьютексом и recv() из канала и завершается лишь по тому, что мы не ждем фоновые потоки. Вариант без deadlock будет выглядеть так:

fn test() {
    let mut channels = Arc::new(Mutex::new(Vec::with_capacity(PAR)));
    let mut joins = Vec::with_capacity(PAR);
    for _ in 0..N / PAR {
        for _ in 0..PAR {
            let mut channels = Arc::clone(&channels);
            joins.push(thread::spawn(move || {
                get(channels.lock().unwrap());
            }));
        }
    }
    for j in joins {
        j.join().unwrap();
    }
}

#[inline(always)]
fn get(mut channels: MutexGuard<Vec<mpsc::Sender<i32>>>) -> i32 {
    let (tx, rx) = mpsc::channel();
    channels.push(tx);
    if channels.len() == PAR {
        exec(channels);
    } else {
        drop(channels); // drop гварда отпускает мьютекс
    }
    rx.recv().unwrap()
}

#[inline(always)]
fn exec(mut channels: MutexGuard<Vec<mpsc::Sender<i32>>>) {
    let mut i = 0;
    for c in channels.iter() {
        i += 1;
        c.send(1).unwrap();
    }
    println!("{}", i);
    channels.clear();
    // а здесь гвард дропнется сам
}

Вторая проблема в том, что все потоки выполняются по сути по очереди, так как ждут разблокировки мьютекса от других потоков, из-за чего многопоточка тут не дает никаких преимуществ, а лишь создает накладные расходы. Ради эксперимента я попробовал заменить мьютекс на еще один канал:

fn test() {
    let (tx, rx) = mpsc::channel::<mpsc::Sender<i32>>();
    let mut handles = Vec::with_capacity(N + 1);
    handles.push(thread::spawn(move || exec(rx)));
    for _ in 0..N {
        let tx = tx.clone();
        handles.push(thread::spawn(move || {
            get(tx);
        }))
    }
    drop(tx);
    for handle in handles {
        handle.join().unwrap();
    }
}

fn get(sender: mpsc::Sender<mpsc::Sender<i32>>) -> i32 {
    let (tx, rx) = mpsc::channel();
    sender.send(tx).unwrap();
    rx.recv().unwrap()
}

fn exec(receiver: mpsc::Receiver<mpsc::Sender<i32>>) {
    let mut channels = Vec::with_capacity(PAR);
    loop {
        for _ in 0..PAR {
            let Ok(tx) = receiver.recv() else {
                return;
            };
            channels.push(tx);
        }
        let mut i = 0;
        for c in channels.iter() {
            i += 1;
            c.send(1).unwrap();
        }
        println!("{}", i);
        channels.clear();
    }
}

Но особо это профита не дает, так как основной пожиратель перфоманса - switch context в ОС. Тысячи потоков делают только хуже. Запускать потоков сильно больше чем есть ядер - это вообще плохая идея. Просто ради интереса переписал еще раз на асинхронных каналах tokio:

async fn test() {
    let (tx, rx) = mpsc::unbounded_channel::<mpsc::UnboundedSender<i32>>();
    let mut handles = Vec::with_capacity(N + 1);
    handles.push(tokio::spawn(async move { exec(rx).await }));
    for _ in 0..N {
        let tx = tx.clone();
        handles.push(tokio::spawn(async move {
            get(tx).await;
        }))
    }
    drop(tx);
    for handle in handles {
        handle.await.unwrap();
    }
}

async fn get(sender: mpsc::UnboundedSender<mpsc::UnboundedSender<i32>>) -> i32 {
    let (tx, mut rx) = mpsc::unbounded_channel();
    sender.send(tx).unwrap();
    rx.recv().await.unwrap()
}

async fn exec(mut receiver: mpsc::UnboundedReceiver<mpsc::UnboundedSender<i32>>) {
    let mut channels = Vec::with_capacity(PAR);
    loop {
        for _ in 0..PAR {
            let Some(tx) = receiver.recv().await else {
                return;
            };
            channels.push(tx);
        }
        let mut i = 0;
        for c in channels.iter() {
            i += 1;
            c.send(1).unwrap();
        }
        println!("{}", i);
        channels.clear();
    }
}

и запустил в многопоточном рантайме в дефолтной конфигурации (количество воркеров == количеству ядер), работает быстрее в 19 раз.

P.S. без I/O операций асинхронщина тоже создает ненужные накладные расходы, я ее здесь использовал только из-за простоты переписывания, лучше взять обычный thread pool с синхронными тасками.

Ответ написан более двух лет назад

Комментировать

Как получать в переменную значение из консоли и буфера обмена?

Василий Банников @vabka Куратор тега Rust

Это уже и так из коробки работает в терминале. Не нужно усложнять своё приложение этим.
Попробуй использовать shift+insert или ctrl+shift+v, если у тебя в терминале на ctrl+v пишется ^V.
Либо посмотри настройки.

Ответ написан более двух лет назад

Комментировать

Как получить путь с коррекцией в переменную?

Дмитрий Беляев @bingo347

Crazy on performance...

https://doc.rust-lang.org/std/path/struct.Path.htm...

let cwd = std::env::current_dir().unwrap().parent().unwrap();

Ответ написан более двух лет назад

2 комментария

Какой Object pool стоит использовать в Rust?

Дмитрий Беляев @bingo347

Crazy on performance...

меня очень смущает постоянно выделять буффер

Конкретно в данном примере буффер выделяется на стеке, то есть на его выделение не тратится ровным счетом ничего, так как стек и так уже выделен при запуске потока.
Есть конечно копеечные затраты ресурсов на заполнение буфера нулями. И если в буффер гарантированно сначала идет запись, как в данном случае, то это в принципе можно обойти:

use std::mem::MaybeUninit;
let mut buffer = unsafe {
    #[allow(invalid_value)]
    MaybeUninit::<[_; 1024]>::uninit().assume_init()
};

Но я бы так не делал. Во-первых чистота кода не стоит этих копеек производительности, а во-вторых немного накосячите с чтением и будет UB.

Ответ написан более двух лет назад

3 комментария

Как правильно принимать данные в потоках?

Дмитрий Беляев @bingo347

Crazy on performance...

Arc нужно клонировать до move в замыкание, которое запускается на потоке. Если данные используются только на чтение, то этого будет достаточно, если данные будут меняться из нескольких потоков, то следует дополнительно обернуть их в Mutex/RwLock (или из std::sync или из библиотеки parking_lot).

use std::sync::Arc;

fn main() {
    let data = Arc::new(vec![1, 2, 3]);

    let thread_1 = std::thread::spawn({
        let data = Arc::clone(&data);
        move || {
            println!("Thread 1 data: {:?}", data);
        }
    });

    let thread_2 = std::thread::spawn({
        let data = Arc::clone(&data);
        move || {
            println!("Thread 2 data: {:?}", data);
        }
    });

    thread_1.join().unwrap();
    thread_2.join().unwrap();
}

Передавать так можно хоть вектор, хоть свою структуру, главное чтоб у типа был трейт Send и лайфтайм 'static (все владеющие типы имеют такой лайфтайм).
Так как передаем мы по сути Arc, то Send должен быть у него, а он будет для любого содержимого реализующего Sync.

Я обернул создание отдельного потока в функцию и так передавал в поток данные. Удобно, что такую функцию могу вынести в отдельный файл-модуль. Но не смог такое сделать динамически в цикле для группы потоков. Хочу подойти к варианту, когда поток, который закончил выполнение своего кода (раньше других), можно опять запустить из main и передать ему новую задачу (новые данные), - структуру данных, которую привёл в основном вопросе.

Если правильно понял, то Вам нужен thread pool. Можно использовать из библиотеки rayon: https://docs.rs/rayon/1.7.0/rayon/struct.ThreadPoo...
Но если хочется повелосипедить, можно нечто такое сделать:

use std::{
    sync::{
        mpsc::{self, Sender},
        Arc, Mutex,
    },
    thread::{self, JoinHandle},
};

type Task = Box<dyn FnOnce() + Send + 'static>;

pub struct ThreadPool {
    handles: Vec<JoinHandle<()>>,
    task_sender: Sender<Task>,
}

impl ThreadPool {
    pub fn new() -> Self {
        let threads_count = thread::available_parallelism()
            .map(|n| n.get())
            .unwrap_or(2);
        let (task_sender, task_receiver) = mpsc::channel::<Task>();
        let task_receiver = Arc::new(Mutex::new(task_receiver));
        let mut handles = Vec::with_capacity(threads_count);
        for _ in 0..threads_count {
            let task_receiver = Arc::clone(&task_receiver);
            handles.push(thread::spawn(move || loop {
                let task_receiver = task_receiver.lock().unwrap_or_else(|e| e.into_inner());
                let Ok(task) = task_receiver.recv() else {
                    return;
                };
                drop(task_receiver);
                task();
            }));
        }
        Self {
            handles,
            task_sender,
        }
    }

    pub fn spawn_task<F: FnOnce() + Send + 'static>(&self, f: F) {
        self.task_sender.send(Box::new(f)).expect("All threads ended");
    }

    pub fn join(self) -> thread::Result<()> {
        drop(self.task_sender);
        for handle in self.handles {
            handle.join()?;
        }
        Ok(())
    }
}

#[test]
fn thread_pool() {
    let pool = ThreadPool::new();
    for i in 0..500 {
        pool.spawn_task(move || {
            println!("Task {} working on thread {:?}", i, thread::current().id());
        });
    }
    pool.join().unwrap();
}

Ответ написан более двух лет назад

3 комментария

Как правильно сложить дату-время в массив?

Дмитрий Беляев @bingo347

Crazy on performance...

use chrono::prelude::*;
use std::sync::mpsc;
use std::sync::mpsc::{Receiver, Sender};
use std::{thread, time};

fn main() {
    println!("- - - - -");
    let mut children = Vec::with_capacity(3);

    for id in 0..children.capacity() {
        let child = thread::spawn(move || {
            let mut date_times = Vec::with_capacity(5);
            for i in 0..date_times.capacity() {
                let t: DateTime<Local> = Local::now();
                date_times.push(t);
                println!("{:?}_ поток, задача _{:?}, время: {:?}", id, i, t);
                thread::sleep(time::Duration::from_millis(3));
            }
            (id, date_times)
        });

        children.push(child);
    }

    for child in children {
        let (id, date_times) = child.join().expect("Дочерний поток паникует");
        println!("thd_{} = {:?}", id, date_times);
    }
    println!("- - - - -");
}

Ответ написан более двух лет назад

1 комментарий

Войдите на сайт