인플럭스DB 데이터 요소

growdeveloper ㅣ 2023. 3. 6. 14:14

InflusionDB 2.0에는 다음 데이터 요소가 포함되어 있습니다.

다음 샘플 데이터는 데이터 요소의 개념을 설명하기위해 사용됩니다.

 

▶타임스템프(timestamp)

influentDB에 저장된 모든 데이터에는 타임스탬프를 저장하는_time 열이 있습니다. 디스크에는 타임스탬프가 에포크 나노초 형식으로 저장됩니다. 유입 DB 형식 타임스탬프는 데이터와 관련된 RFC 3339 UTC의 날짜와 시간을 보여줍니다. 데이터를 쓸 때는 타임스탬프 정확도가 중요합니다.

 

▶측정(Measurement)

측정 열에는 측정 컬럼의 이름이 표시됩니다. 측정 이름은 문자열이고 측정은 태그, 필드 및 타임스탬프의 컨테이너 역할을 합니다 .데이터를 설명하는 측정 이름을 사용합니다. 인구 조사라는 이

름은 우리에게 벌과 개미의 수를 기록하는 현장 가치를 말해줍니다.

 

Fields

필드에는 _field 열에 저장된 필드 키와 _value 열에 저장된 필드 값이 포함됩니다.

 

Field key

필드 키는 필드 이름을 나타내는 문자열입니다. 위의 표본 데이터에서 벌과 개미는 필드 키 입니다.

 

Field value

필드 값은 연관된 필드의 값을 나타냅니다. 필드 값은 문자열, 플로트 정수 또는 부울 값일 수 있습니다. 표본 데이터의 필드 값은 지정된 시간에 벌의 수(23과 29)와 지정된 시간에 개미의 수(30과 32)를 나타냅니다.

 

Filed set

필드 세트는 타임스탬프와 관련된 필드 키와 값 쌍의 집합입니다. 샘플데이터 에는 다음 필드 세트가 포함됩니다.

 

 census bees=23i,ants=30i 1566086400000000000 census bees=28i,ants=32i 1566086760000000000        -----------------            Field set

 

Tags are indexed:
 Tags are optional. You don’t need tags in your data structure, but it’s typically a good idea to include tags. Because tags are indexed, queries on tags are faster than queries on fields. This makes tags ideal for storing commonly-queried metadata.

태그가 인덱싱됨: 태그는 선택 사항입니다. 데이터 구조에 태그가 필요하지는 않지만 일반적으로 태그를 포함하는 것이 좋습니다. 태그는 색인화되므로 태그의 쿼리가 필드의 쿼리보다 빠릅니다. 따라서 태그는 일반적으로 쿼리되는 메타데이터를 저장하는 데 이상적입니다.
Tags containing highly variable information like UUIDs, hashes, and random strings will lead to a large number of unique series in the database, known as high series cardinality. High series cardinality is a primary driver of high memory usage for many database workloads. See series cardinality for more information.

UUID, 해시 및 임의 문자열과 같은 매우 가변적인 정보를 포함하는 태그는 높은 시리즈 카디널리티로 알려진 데이터베이스의 고유한 시리즈를 많이 생성합니다. 높은 직렬 카디널리티는 많은 데이터베이스 워크로드에서 높은 메모리 사용량의 주요 동인입니다. 자세한 내용은 시리즈 카디널리티를 참조하십시오.

스키마가 중요한 이유

예를 들어, 대부분의 쿼리가 필드의 값에 초점을 맞추고 있는 경우, 23개의 별이 언제 카운트되었는지 확인 하는 쿼리:

from(bucket: "bucket-name")    > range(start: 2019-08-17T00:00:00Z, stop: 2019-08-19T00:00:00Z)    > filter(fn: (r) => r._field == "bees" and r._value == 23)

InfluxDB 는 쿼리가 응답을 반환하기 전에 데이터 집합의 모든 필드 값을 검색합니다. 샘플 인구 조사 데이터가 수백만 행으로 증가한 경우 쿼리를 최적화 하기 위해 필드(벌과 개미)가 태그가 되고 태그(위치와 과확사)가 필드가 될 수 있도록 스키마를 다시 정렬할 수 있습니다.

이제 벌과 개미가 태그 이므로 influsDB는 모든 _field 및 _value 열을 검색할 필요가 없습니다 .이렇게 하면 쿼리 속도가 빨라집니다.

▶Bucket schema

influxDB Cloud에서 명시적 스키마 유형을 가진 버킷에서 각측정에 대한 명시적 스키마가 필요합니다. 측정에는 태그, 필드 및 타임스탬가 포함됩니다. 명시적 스키마는 해당 측정에 쓸 수 있는 데이터의 모양을 제한합니다.

▶Series

이제 측정, 필드 세트 및 태그 세트에 대해 잘 알았으므로 영상 시지르 키와 영성 시리즈에 대해 설명할 시간입니다. 직렬 키는 측정, 태그 세트 및 필드 키를 공유하는 점의 모음입니다. 예를 들어, 표본 데이터에는 두 개의 고유한 열 키가 포함되어 있습니다.

영상 시리즈에는 지정된 영상 시리즈 키에 대한 타임스탬프 및 필드 값이 포함됩니다 .샘플 데이터의 영상 시리즈 키와 해당 영상 시리즈는 다음과 같습니다.

# series key census,location=klamath,scientist=anderson bees  # series 2019-08-18T00:00:00Z 23 2019-08-18T00:06:00Z 28

일련의 개념을 이해하는 것은 스키마를 설계하고 influxDB에서 데이터를 작업할 때 필수적 입니다.

 

▶Point

포인트는 열 키, 필드 값 및 타임스탬프를 포함한다, 예를 들어, 표본 데이터의 단일 점은 다음과 같습니다.

 

2019-08-18T00:00:00Z census ants 30 portland mullen

▶Bucket

모든 influxDB 데이터는 버킷에 저장됩니다. 버킷은 데이터베이스의 개념과 보존 기간(각 데이터 지점이 지속되는 기간)을 결합합니다. 버킷은 조직에 속합니다.

 

'InfluxDB' 카테고리의 다른 글

인플럭스 데이터 이동  (0) 2023.06.21
Query InfluxDB with Flux  (0) 2023.06.15
InfluxDB 설계 원칙  (0) 2023.06.14
인플럭스 DB data elements  (0) 2023.06.13
InfluxDB 설치하기  (0) 2023.03.03