Delete src/server/csv_import_export.rs

This commit is contained in:
Григорий Сафронов 2026-01-20 20:39:19 +00:00
parent 9c3d82062b
commit 2e70694485

View File

@ -1,383 +0,0 @@
// src/server/csv_import_export.rs
//! Lock-free модуль для импорта/экспорта данных в формате CSV
//!
//! Основные функции:
//! 1. Импорт CSV файлов в коллекции базы данных
//! 2. Экспорт коллекций в CSV файлы
//! 3. Отслеживание прогресса импорта с атомарными счетчиками
//! 4. Буферизация операций для повышения производительности
//!
//! Особенности:
//! - Атомарные операции без блокировок через DashMap
//! - Автоматическое определение типов данных
//! - Обработка больших файлов с пагинацией
//! - Отслеживание прогресса в реальном времени
use std::sync::Arc;
use std::fs::File;
use std::io::{BufReader, BufWriter};
use std::path::Path;
use std::sync::atomic::{AtomicUsize, AtomicBool, Ordering};
use csv::{Reader, Writer};
use serde_json::Value;
use dashmap::DashMap;
use tokio::sync::RwLock;
use crate::common::Result;
use crate::common::config::CsvConfig;
use crate::server::database::Database;
/// Lock-free хэш-таблица для прогресса импорта
/// Использует DashMap для атомарного доступа к данным прогресса
struct LockFreeProgressMap {
progress_data: DashMap<String, f64>,
active_imports: AtomicUsize,
}
impl LockFreeProgressMap {
fn new() -> Self {
Self {
progress_data: DashMap::new(),
active_imports: AtomicUsize::new(0),
}
}
fn insert(&self, key: String, value: f64) -> Option<f64> {
if value == 100.0 {
// Импорт завершен, удаляем из активных
self.active_imports.fetch_sub(1, Ordering::SeqCst);
} else if value == 0.0 {
// Начинаем новый импорт
self.active_imports.fetch_add(1, Ordering::SeqCst);
}
self.progress_data.insert(key, value)
}
fn get(&self, key: &str) -> Option<f64> {
self.progress_data.get(key).map(|entry| *entry)
}
fn remove(&self, key: &str) -> Option<f64> {
self.progress_data.remove(key).map(|(_, v)| v)
}
fn len(&self) -> usize {
self.progress_data.len()
}
fn active_imports(&self) -> usize {
self.active_imports.load(Ordering::SeqCst)
}
}
/// Менеджер CSV операций с lock-free архитектурой
#[derive(Clone)]
pub struct CsvManager {
database: Arc<Database>,
config: CsvConfig,
import_progress: Arc<LockFreeProgressMap>,
// Используем RwLock для буферизации, но без блокировок на операции
import_buffer: Arc<RwLock<DashMap<String, Vec<Value>>>>,
}
impl CsvManager {
pub fn new(database: Arc<Database>, config: CsvConfig) -> Self {
// Создаем директории для импорта и экспорта, если они не существуют
let _ = std::fs::create_dir_all(&config.import_dir);
let _ = std::fs::create_dir_all(&config.export_dir);
Self {
database,
config,
import_progress: Arc::new(LockFreeProgressMap::new()),
import_buffer: Arc::new(RwLock::new(DashMap::new())),
}
}
pub fn import_csv(&self, collection_name: &str, file_path: &str) -> Result<usize> {
// Проверяем размер файла
let metadata = std::fs::metadata(file_path)
.map_err(|e| crate::common::FutriixError::IoError(e))?;
if metadata.len() > self.config.max_file_size {
return Err(crate::common::FutriixError::CsvError(
format!("File size {} exceeds maximum allowed size {}",
metadata.len(), self.config.max_file_size)
));
}
println!("Importing CSV file '{}' into collection '{}'", file_path, collection_name);
// Открываем файл для чтения
let file = File::open(file_path)
.map_err(|e| crate::common::FutriixError::IoError(e))?;
let mut reader = Reader::from_reader(BufReader::new(file));
// Читаем заголовки
let headers: Vec<String> = reader.headers()?
.iter()
.map(|s| s.to_string())
.collect();
let mut record_count = 0;
// Убираем mut, так как переменная не изменяется
let error_count = 0;
// Начинаем импорт
self.import_progress.insert(collection_name.to_string(), 0.0);
// Буферизируем записи для batch вставки
let mut buffer = Vec::new();
for result in reader.records() {
let record = result?;
let mut document = serde_json::Map::new();
for (i, field) in record.iter().enumerate() {
let header = if i < headers.len() {
&headers[i]
} else {
&format!("field_{}", i)
};
let value = Self::parse_field_value(field);
document.insert(header.to_string(), value);
}
let json_value = Value::Object(document);
buffer.push(json_value);
if buffer.len() >= 100 {
// Вставляем пачку записей
let inserted = self.insert_batch(collection_name, &buffer)?;
record_count += inserted;
buffer.clear();
if record_count % 100 == 0 {
println!("Imported {} records...", record_count);
let progress = (record_count as f64 / 1000.0) * 100.0;
self.import_progress.insert(collection_name.to_string(), progress);
}
}
}
// Вставляем оставшиеся записи
if !buffer.is_empty() {
let inserted = self.insert_batch(collection_name, &buffer)?;
record_count += inserted;
}
// Завершаем импорт
self.import_progress.insert(collection_name.to_string(), 100.0);
if error_count > 0 {
println!("Import completed with {} successful records and {} errors",
record_count, error_count);
} else {
println!("Successfully imported {} records into collection '{}'",
record_count, collection_name);
}
Ok(record_count)
}
/// Вставляет пачку документов атомарно
fn insert_batch(&self, collection_name: &str, documents: &[Value]) -> Result<usize> {
let mut inserted = 0;
for document in documents {
let json_string = serde_json::to_string(document)?;
let command = crate::common::protocol::Command::Create {
collection: collection_name.to_string(),
document: json_string.into_bytes(),
};
match self.database.execute_command(command) {
Ok(_) => {
inserted += 1;
}
Err(e) => {
eprintln!("Failed to import record: {}", e);
}
}
}
Ok(inserted)
}
/// Парсит строковое значение поля в соответствующий тип JSON
fn parse_field_value(field: &str) -> Value {
if field.is_empty() {
return Value::Null;
}
// Пытаемся распарсить как целое число
if let Ok(int_val) = field.parse::<i64>() {
return Value::Number(int_val.into());
}
// Пытаемся распарсить как число с плавающей точкой
if let Ok(float_val) = field.parse::<f64>() {
if let Some(num) = serde_json::Number::from_f64(float_val) {
return Value::Number(num);
}
}
// Проверяем булевые значения
match field.to_lowercase().as_str() {
"true" => return Value::Bool(true),
"false" => return Value::Bool(false),
_ => {}
}
// По умолчанию возвращаем как строку
Value::String(field.to_string())
}
pub fn export_csv(&self, collection_name: &str, file_path: &str) -> Result<usize> {
println!("Exporting collection '{}' to CSV file '{}'", collection_name, file_path);
// Создаем файл для записи
let file = File::create(file_path)
.map_err(|e| crate::common::FutriixError::IoError(e))?;
let mut writer = Writer::from_writer(BufWriter::new(file));
// Запрашиваем все документы из коллекции
let command = crate::common::protocol::Command::Query {
collection: collection_name.to_string(),
filter: vec![],
};
let response = self.database.execute_command(command)?;
let documents = match response {
crate::common::protocol::Response::Success(data) => {
serde_json::from_slice::<Vec<Value>>(&data)?
}
crate::common::protocol::Response::Error(e) => {
return Err(crate::common::FutriixError::DatabaseError(e));
}
};
if documents.is_empty() {
println!("Collection '{}' is empty", collection_name);
return Ok(0);
}
// Собираем все уникальные заголовки из документов
// Убираем mut, так как DashSet не требует изменяемости для итерации
let all_headers = dashmap::DashSet::new();
for document in &documents {
if let Value::Object(obj) = document {
for key in obj.keys() {
all_headers.insert(key.clone());
}
}
}
let headers: Vec<String> = all_headers.into_iter().collect();
// Записываем заголовки
writer.write_record(&headers)?;
let mut record_count = 0;
// Экспортируем документы
for document in documents {
if let Value::Object(obj) = document {
let mut record = Vec::new();
for header in &headers {
let value = obj.get(header).unwrap_or(&Value::Null);
let value_str = Self::value_to_string(value);
record.push(value_str);
}
writer.write_record(&record)?;
record_count += 1;
if record_count % 100 == 0 {
println!("Exported {} records...", record_count);
}
}
}
writer.flush()?;
println!("Successfully exported {} records to '{}'", record_count, file_path);
Ok(record_count)
}
/// Конвертирует JSON значение в строку для CSV
fn value_to_string(value: &Value) -> String {
match value {
Value::String(s) => s.clone(),
Value::Number(n) => n.to_string(),
Value::Bool(b) => b.to_string(),
Value::Null => "".to_string(),
Value::Array(arr) => {
let items: Vec<String> = arr.iter().map(Self::value_to_string).collect();
format!("[{}]", items.join(","))
}
Value::Object(_) => {
// Для объектов используем JSON строку
value.to_string()
}
}
}
pub fn get_import_progress(&self, collection_name: &str) -> f64 {
self.import_progress.get(collection_name)
.unwrap_or(0.0)
}
pub fn list_csv_files(&self) -> Result<Vec<String>> {
let csv_dir = &self.config.import_dir;
let mut csv_files = Vec::new();
if let Ok(entries) = std::fs::read_dir(csv_dir) {
for entry in entries.flatten() {
let path = entry.path();
if path.is_file() {
if let Some(extension) = path.extension() {
if extension == "csv" || extension == "CSV" {
if let Some(file_name) = path.file_name() {
csv_files.push(file_name.to_string_lossy().to_string());
}
}
}
}
}
}
Ok(csv_files)
}
pub fn get_import_file_path(&self, file_name: &str) -> String {
Path::new(&self.config.import_dir)
.join(file_name)
.to_string_lossy()
.to_string()
}
pub fn get_export_file_path(&self, file_name: &str) -> String {
Path::new(&self.config.export_dir)
.join(file_name)
.to_string_lossy()
.to_string()
}
pub fn file_exists(&self, file_path: &str) -> bool {
Path::new(file_path).exists()
}
pub fn active_imports_count(&self) -> usize {
self.import_progress.active_imports()
}
}