Struct ArrowReaderBuilder

Source

pub struct ArrowReaderBuilder<T> {
    pub(crate) input: T,
    pub(crate) metadata: Arc<ParquetMetaData>,
    pub(crate) schema: SchemaRef,
    pub(crate) fields: Option<Arc<ParquetField>>,
    pub(crate) batch_size: usize,
    pub(crate) row_groups: Option<Vec<usize>>,
    pub(crate) projection: ProjectionMask,
    pub(crate) filter: Option<RowFilter>,
    pub(crate) selection: Option<RowSelection>,
    pub(crate) limit: Option<usize>,
    pub(crate) offset: Option<usize>,
}

Expand description

Builder for constructing parquet readers into arrow.

Most users should use one of the following specializations:

synchronous API: ParquetRecordBatchReaderBuilder::try_new
async API: ParquetRecordBatchStreamBuilder::new

Fields§

§input: T§metadata: Arc<ParquetMetaData>§schema: SchemaRef§fields: Option<Arc<ParquetField>>§batch_size: usize§row_groups: Option<Vec<usize>>§projection: ProjectionMask§filter: Option<RowFilter>§selection: Option<RowSelection>§limit: Option<usize>§offset: Option<usize>

Struct ArrowReaderBuilderCopy item path

Fields§

Implementations§

impl<T> ArrowReaderBuilder<T>

pub(crate) fn new_builder(input: T, metadata: ArrowReaderMetadata) -> Self

pub fn metadata(&self) -> &Arc<ParquetMetaData>

pub fn parquet_schema(&self) -> &SchemaDescriptor

pub fn schema(&self) -> &SchemaRef

pub fn with_batch_size(self, batch_size: usize) -> Self

pub fn with_row_groups(self, row_groups: Vec<usize>) -> Self

pub fn with_projection(self, mask: ProjectionMask) -> Self

pub fn with_row_selection(self, selection: RowSelection) -> Self

§Notes

§Example

pub fn with_row_filter(self, filter: RowFilter) -> Self

pub fn with_limit(self, limit: usize) -> Self

pub fn with_offset(self, offset: usize) -> Self

impl<T: ChunkReader + 'static> ArrowReaderBuilder<SyncReader<T>>

pub fn try_new(reader: T) -> Result<Self>

pub fn try_new_with_options( reader: T, options: ArrowReaderOptions, ) -> Result<Self>

pub fn new_with_metadata(input: T, metadata: ArrowReaderMetadata) -> Self

§Example

pub fn build(self) -> Result<ParquetRecordBatchReader>

impl<T: AsyncFileReader + Send + 'static> ArrowReaderBuilder<AsyncReader<T>>

pub async fn new(input: T) -> Result<Self>

§Example

pub async fn new_with_options( input: T, options: ArrowReaderOptions, ) -> Result<Self>

pub fn new_with_metadata(input: T, metadata: ArrowReaderMetadata) -> Self

§Example of reading from multiple streams in parallel

pub async fn get_row_group_column_bloom_filter( &mut self, row_group_idx: usize, column_idx: usize, ) -> Result<Option<Sbbf>>

pub fn build(self) -> Result<ParquetRecordBatchStream<T>>

Auto Trait Implementations§

impl<T> Freeze for ArrowReaderBuilder<T>where T: Freeze,

impl<T> !RefUnwindSafe for ArrowReaderBuilder<T>

impl<T> Send for ArrowReaderBuilder<T>where T: Send,

impl<T> !Sync for ArrowReaderBuilder<T>

impl<T> Unpin for ArrowReaderBuilder<T>where T: Unpin,

impl<T> !UnwindSafe for ArrowReaderBuilder<T>

Blanket Implementations§

impl<T> Any for Twhere T: 'static + ?Sized,

fn type_id(&self) -> TypeId

impl<T> Borrow<T> for Twhere T: ?Sized,

fn borrow(&self) -> &T

impl<T> BorrowMut<T> for Twhere T: ?Sized,

fn borrow_mut(&mut self) -> &mut T

impl<T> From<T> for T

fn from(t: T) -> T

impl<T, U> Into<U> for Twhere U: From<T>,

fn into(self) -> U

impl<T> IntoEither for T

fn into_either(self, into_left: bool) -> Either<Self, Self>

fn into_either_with<F>(self, into_left: F) -> Either<Self, Self>where F: FnOnce(&Self) -> bool,

impl<T, U> TryFrom<U> for Twhere U: Into<T>,

type Error = Infallible

fn try_from(value: U) -> Result<T, <T as TryFrom<U>>::Error>

impl<T, U> TryInto<U> for Twhere U: TryFrom<T>,

type Error = <U as TryFrom<T>>::Error

fn try_into(self) -> Result<U, <U as TryFrom<T>>::Error>

impl<T> ErasedDestructor for Twhere T: 'static,

impl<T> MaybeSendSync for T

Struct ArrowReaderBuilder

impl<T> Freeze for ArrowReaderBuilder<T>
where T: Freeze,

impl<T> Send for ArrowReaderBuilder<T>
where T: Send,

impl<T> Unpin for ArrowReaderBuilder<T>
where T: Unpin,

impl<T> Any for T
where T: 'static + ?Sized,

impl<T> Borrow<T> for T
where T: ?Sized,

impl<T> BorrowMut<T> for T
where T: ?Sized,

impl<T, U> Into<U> for T
where U: From<T>,

fn into_either_with<F>(self, into_left: F) -> Either<Self, Self>
where F: FnOnce(&Self) -> bool,

impl<T, U> TryFrom<U> for T
where U: Into<T>,

impl<T, U> TryInto<U> for T
where U: TryFrom<T>,

impl<T> ErasedDestructor for T
where T: 'static,