독립적인 샘플 처리에는 두 가지 주요 장점이 있습니다: 계산 시간은 샘플 수에 선형이며 메모리 요구 사항은 샘플 수와 일치합니다. 그러나 풀링을 사용하면 샘플 간에 정보를 공유할 수 있으므로 한 샘플에서 단일톤 또는 더블톤으로 존재했지만 샘플 간에 여러 번 존재했던 희귀 변형을 쉽게 해결할 수 있습니다. 풀링된 샘플 추론은 dada(…, pool=TRUE)를 호출하여 지원됩니다. 선형 시간으로 전체 풀링을 근사화하는 버전 1.8에 도입된 의사 풀링 접근 방식도 참조하십시오. 풀린 샘플 추론은 이 경우 약 2배 더 오래 걸렸지만 스터디 크기가 증가함에 따라 독립 및 풀처리 간의 델타가 증가합니다. 실제로 풀링 처리는 Miseq 스케일 데이터(특히 멀티스레딩을 활용하는 경우)에 사용할 수 있지만 샘플별 처리는 모든 스터디 크기(예: 20 Hiseq 실행)에 맞게 계산 가능한 상태로 유지됩니다. 그리고 우리는이 샘플에서 오류 율을 배울 수 있습니다 : 그것은 방법의 감도에 따라 달라집니다 … 10l는 exmaple에 대한 50l보다 적은 양의 분석은 있을 것입니다: 10l 견본이 2mg 단백질을 포함하는 경우에 50l는 10mg을 포함할 것입니다. 샘플 간의 레이블을 풀링하지 않고 샘플 1및 OTU1 샘플 2의 OTU1은 동일하지 않습니다. DADA2는 앰플리톤 서열 변이체를 정확하게 해결하고 정확한 DNA 서열이 일관된 라벨이기 때문에 DADA2에 의해 독립적으로 처리된 다음 결합할 수 있으며 이것이 기본 동작입니다. 그래 물론 우리는 같은 방법으로 테스트 및 제어 그룹을 치료해야합니다…. 우리는 특정 샘플에 대한 샘플의 50 마이크로L을 필요로하지만 우리는 각 주제에서 10 마이크로 L을 받고있다면 …

이 경우 샘플을 풀합니다. 우리는 그룹에 8 과목이있는 경우 (테스트뿐만 아니라 제어) 우리는 80 microL 샘플을 해야합니다.. 50 마이크로L 샘플을 사용하여 실험을 수행 할 수 있습니다. 실험의 결과로 얻는 값은 평균 값으로 간주됩니다… 따라서 테스트에서 두 개의 평균 값과 컨트롤에서 두 개의 평균 값이 있습니다. 그래서, 지금 문제는 비교입니다 … 우리는 결과의 중요성을 계산하기 위해 표준 편차 (SD)가 없습니다 … 그래서 내 문제는 우리가 두 가지 수단 위드 아웃 SD를 비교할 수있는 방법이다? 동일한 연구 그룹의 과목에서 가져온 샘플 볼륨을 결합합니다. 한 그룹에 8명의 과목이 있다고 가정한 다음 각 피험자로부터 얻은 샘플을 결합하여 하나의 샘플을 형성한다고 가정합니다. 기본적으로 당신은 할 수 없습니다 – 당신은 당신이 당신의 컨트롤에 비교할 수있는 더 많은 샘플 (그룹)을 얻을 필요가있다.

대부분의 ASV및 대부분의 읽기(>99%) 일반적으로 이러한 메서드 간에 할당됩니다. 두 방법 중 어느 쪽이든 샘플링된 커뮤니티를 정확하게 재구성할 수 있습니다. 예상대로 풀링은 희귀 변이체를 감지하는 전력 증가로 인해 몇 가지 앰플리톤 시퀀스 변이체(ASV)를 더 검출했습니다. dada 함수는 dada2 패키지의 핵심에 고해상도 샘플 추론을 구현합니다. 다다(dada)는 앰플리톤 서열 변이체(ASV)를 정확하게 해결하기 때문에 최종 시퀀스 테이블에서 샘플을 조합하기 전에 샘플을 별도로 분석할 수 있습니다. 그러나 dada 함수를 사용하면 샘플을 함께 샘플 추론으로 풀화할 수도 있습니다. 여기서는 이러한 기능을 시연하고 풀링의 장단점에 대해 설명합니다. 기본 샘플별 추론을 사용하여 샘플을 처리하여 시작해 보겠습니다: 간단히 하기 위해 앞으로 읽기만 잘라내고 필터링하겠습니다: 자습서에 사용된 것과 동일한 데이터로 작업할 것이므로 이미 없는 경우 해당 데이터를 수집한 다음 그 위치에 대한 작업 디렉토리 : 이 책은 일반 의료 종사자를위한 것입니다, 심장 전문의와 같은 전문가, 신경학자, 당뇨병 전문의, 생화학자, 영양사, 약사, 또한 대학원생을위한.