`DataManager`

BaseDataManager

Bases: ABC

Base data manager for loading and saving data.

Source code in utu/eval/data/data_manager.py

class BaseDataManager(abc.ABC):
    """Base data manager for loading and saving data."""

    data: list[EvaluationSample]

    def __init__(self, config: EvalConfig) -> None:
        self.config = config

    @abc.abstractmethod
    def load(self) -> list[EvaluationSample]:
        """Load the dataset."""
        raise NotImplementedError

    @abc.abstractmethod
    def save(self, **kwargs) -> None:
        """Save the dataset."""
        raise NotImplementedError

    @abc.abstractmethod
    def get_samples(self, stage: Literal["init", "rollout", "judged"] = None) -> list[EvaluationSample]:
        """Get samples of specified stage from the dataset."""
        raise NotImplementedError

load `abstractmethod`

load() -> list[EvaluationSample]

Load the dataset.

Source code in utu/eval/data/data_manager.py

@abc.abstractmethod
def load(self) -> list[EvaluationSample]:
    """Load the dataset."""
    raise NotImplementedError

save `abstractmethod`

save(**kwargs) -> None

Save the dataset.

Source code in utu/eval/data/data_manager.py

@abc.abstractmethod
def save(self, **kwargs) -> None:
    """Save the dataset."""
    raise NotImplementedError

get_samples `abstractmethod`

get_samples(
    stage: Literal["init", "rollout", "judged"] = None,
) -> list[EvaluationSample]

Get samples of specified stage from the dataset.

Source code in utu/eval/data/data_manager.py

@abc.abstractmethod
def get_samples(self, stage: Literal["init", "rollout", "judged"] = None) -> list[EvaluationSample]:
    """Get samples of specified stage from the dataset."""
    raise NotImplementedError

FileDataManager

Bases: BaseDataManager

File data manager for loading and saving data.

Source code in utu/eval/data/data_manager.py

class FileDataManager(BaseDataManager):
    """File data manager for loading and saving data."""

    def load(self) -> list[EvaluationSample]:
        """Load raw data from the specified dataset."""
        data_path = self._get_data_path()
        samples = []
        with open(data_path, encoding="utf-8") as f:
            for line in f:
                data = json.loads(line.strip())
                # assert "source" in data, f"Missing source in data: {data}"
                # assert data["source"].lower() in DATA_PROCESSER_FACTORY._registry, f"Unknown source: {data['source']}"
                sample = EvaluationSample(
                    source=data.get("source", self.config.data.dataset),
                    raw_question=data.get(self.config.data.question_field, ""),
                    level=data.get("level", 0),  # if applicable
                    correct_answer=data.get(self.config.data.gt_field, ""),
                    file_name=data.get("file name", ""),  # for GAIA
                    exp_id=self.config.exp_id,  # add exp_id
                )
                samples.append(sample)
        self.data = samples
        return samples

    def _get_data_path(self) -> pathlib.Path:
        if self.config.data.type == "single" and self.config.data.dataset in BUILTIN_BENCHMARKS:
            data_path = pathlib.Path(BUILTIN_BENCHMARKS[self.config.data.dataset]["data_path"])
        else:
            data_path = pathlib.Path(self.config.data.dataset)
        assert data_path.exists(), f"Data file {data_path} does not exist."
        assert str(data_path).endswith(".jsonl"), f"Only support .jsonl files, but got {data_path}."
        return data_path

    def get_samples(self, stage: Literal["init", "rollout", "judged"] = None) -> list[EvaluationSample]:
        return [d for d in self.data if d.stage == stage]

    def save(self, ofn: str) -> None:
        with open(ofn, "w", encoding="utf-8") as f:
            for sample in self.data:
                f.write(json.dumps(sample.as_dict()) + "\n")

load

load() -> list[EvaluationSample]

Load raw data from the specified dataset.

Source code in utu/eval/data/data_manager.py

def load(self) -> list[EvaluationSample]:
    """Load raw data from the specified dataset."""
    data_path = self._get_data_path()
    samples = []
    with open(data_path, encoding="utf-8") as f:
        for line in f:
            data = json.loads(line.strip())
            # assert "source" in data, f"Missing source in data: {data}"
            # assert data["source"].lower() in DATA_PROCESSER_FACTORY._registry, f"Unknown source: {data['source']}"
            sample = EvaluationSample(
                source=data.get("source", self.config.data.dataset),
                raw_question=data.get(self.config.data.question_field, ""),
                level=data.get("level", 0),  # if applicable
                correct_answer=data.get(self.config.data.gt_field, ""),
                file_name=data.get("file name", ""),  # for GAIA
                exp_id=self.config.exp_id,  # add exp_id
            )
            samples.append(sample)
    self.data = samples
    return samples

DBDataManager

Bases: FileDataManager

Database data manager for loading and saving data.

Source code in utu/eval/data/data_manager.py

class DBDataManager(FileDataManager):
    """Database data manager for loading and saving data."""

    def __init__(self, config: EvalConfig) -> None:
        self.config = config

    def load(self) -> list[EvaluationSample]:
        if self._check_exp_id():
            logger.warning(f"exp_id {self.config.exp_id} already exists in db")
            return self.get_samples()

        with SQLModelUtils.create_session() as session:
            datapoints = session.exec(
                select(DatasetSample).where(DatasetSample.dataset == self.config.data.dataset)
            ).all()
            logger.info(f"Loaded {len(datapoints)} samples from {self.config.data.dataset}.")
            samples = []
            for dp in datapoints:
                sample = EvaluationSample(
                    dataset=dp.dataset,
                    dataset_index=dp.index,
                    source=dp.source,
                    raw_question=dp.question,
                    level=dp.level,
                    correct_answer=dp.answer,
                    file_name=dp.file_name,
                    meta=dp.meta,
                    exp_id=self.config.exp_id,  # add exp_id
                )
                samples.append(sample)

            self.data = samples
            self.save(self.data)  # save to db
            return self.data

    def get_samples(
        self, stage: Literal["init", "rollout", "judged"] = None, limit: int = None
    ) -> list[EvaluationSample]:
        """Get samples from exp_id with specified stage."""
        with SQLModelUtils.create_session() as session:
            samples = session.exec(
                select(EvaluationSample)
                .where(
                    EvaluationSample.exp_id == self.config.exp_id,
                    EvaluationSample.stage == stage if stage else True,
                )
                .order_by(EvaluationSample.dataset_index)
                .limit(limit)
            ).all()
            return samples

    def save(self, samples: list[EvaluationSample] | EvaluationSample) -> None:
        """Update or add sample(s) to db."""
        if isinstance(samples, list):
            with SQLModelUtils.create_session() as session:
                session.add_all(samples)
                session.commit()
        else:
            with SQLModelUtils.create_session() as session:
                session.add(samples)
                session.commit()

    def delete_samples(self, samples: list[EvaluationSample] | EvaluationSample) -> None:
        """Delete sample(s) from db."""
        if isinstance(samples, list):
            with SQLModelUtils.create_session() as session:
                for sample in samples:
                    session.delete(sample)
                session.commit()
        else:
            with SQLModelUtils.create_session() as session:
                session.delete(samples)
                session.commit()

    def _check_exp_id(self) -> bool:
        # check if any record has the same exp_id
        with SQLModelUtils.create_session() as session:
            has_exp_id = session.exec(
                select(EvaluationSample).where(EvaluationSample.exp_id == self.config.exp_id)
            ).first()
        return has_exp_id is not None

get_samples

get_samples(
    stage: Literal["init", "rollout", "judged"] = None,
    limit: int = None,
) -> list[EvaluationSample]

Get samples from exp_id with specified stage.

Source code in utu/eval/data/data_manager.py

def get_samples(
    self, stage: Literal["init", "rollout", "judged"] = None, limit: int = None
) -> list[EvaluationSample]:
    """Get samples from exp_id with specified stage."""
    with SQLModelUtils.create_session() as session:
        samples = session.exec(
            select(EvaluationSample)
            .where(
                EvaluationSample.exp_id == self.config.exp_id,
                EvaluationSample.stage == stage if stage else True,
            )
            .order_by(EvaluationSample.dataset_index)
            .limit(limit)
        ).all()
        return samples

save

save(
    samples: list[EvaluationSample] | EvaluationSample,
) -> None

Update or add sample(s) to db.

Source code in utu/eval/data/data_manager.py

def save(self, samples: list[EvaluationSample] | EvaluationSample) -> None:
    """Update or add sample(s) to db."""
    if isinstance(samples, list):
        with SQLModelUtils.create_session() as session:
            session.add_all(samples)
            session.commit()
    else:
        with SQLModelUtils.create_session() as session:
            session.add(samples)
            session.commit()

delete_samples

delete_samples(
    samples: list[EvaluationSample] | EvaluationSample,
) -> None

Delete sample(s) from db.

Source code in utu/eval/data/data_manager.py

def delete_samples(self, samples: list[EvaluationSample] | EvaluationSample) -> None:
    """Delete sample(s) from db."""
    if isinstance(samples, list):
        with SQLModelUtils.create_session() as session:
            for sample in samples:
                session.delete(sample)
            session.commit()
    else:
        with SQLModelUtils.create_session() as session:
            session.delete(samples)
            session.commit()

DataManager

BaseDataManager

load abstractmethod

save abstractmethod

get_samples abstractmethod

FileDataManager

load

DBDataManager

get_samples

save

delete_samples

`DataManager`

load `abstractmethod`

save `abstractmethod`

get_samples `abstractmethod`