DataFrame.query Query the DataFrame by the result of a logical comparison or boolean mask.
danfo.DataFrame.query (kwargs)
Parameters Type Description Default {
condition: A logical boolean mask,
column : str, name of the column
is: Logical operator, one of ">", "<", ">=", "<=", and. "=="
to : Int, Float, Str. Value to compare against,
inplace : boolean. true
false. Whether to perform operation to the original Object or create a new one.
}
Examples
Query a DataFrame using a boolean mask
Querying by a boolean condition is supported from v0.3.0 and above.
Copy const dfd = require ( "danfojs-node" )
let data = {
"A" : [ "Ng" , "Yu" , "Mo" , "Ng" ] ,
"B" : [ 34 , 4 , 5 , 6 ] ,
"C" : [ 20 , 20 , 30 , 40 ]
}
let df = new dfd .DataFrame (data)
df .print ()
let query_df = df .query (df[ "B" ] .gt ( 5 ))
query_df .print () //after query
Copy ╔════════════╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B │ C ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ Ng │ 34 │ 20 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 1 │ Yu │ 4 │ 20 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 2 │ Mo │ 5 │ 30 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 3 │ Ng │ 6 │ 40 ║
╚════════════╧═══════════════════╧═══════════════════╧═══════════════════╝
╔════════════╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B │ C ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ Ng │ 34 │ 20 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 3 │ Ng │ 6 │ 40 ║
╚════════════╧═══════════════════╧═══════════════════╧═══════════════════╝
It also supports condition chaining as long as the final boolean mask is the same length as the DataFrame rows. For example in the following code, we use multiple chaining conditions:
Copy const dfd = require ( "danfojs-node" )
let data = {
"A" : [ "Ng" , "Yu" , "Mo" , "Ng" ] ,
"B" : [ 34 , 4 , 5 , 6 ] ,
"C" : [ 20 , 20 , 30 , 40 ]
}
let df = new dfd .DataFrame (data)
df .print ()
let query_df = df .query (df[ "B" ] .gt ( 5 ) .and (df[ "C" ] .lt ( 40 )))
query_df .print () //after query
Copy // output
╔════════════╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B │ C ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ Ng │ 34 │ 20 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 1 │ Yu │ 4 │ 20 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 2 │ Mo │ 5 │ 30 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 3 │ Ng │ 6 │ 40 ║
╚════════════╧═══════════════════╧═══════════════════╧═══════════════════╝
╔════════════╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B │ C ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ Ng │ 34 │ 20 ║
╚════════════╧═══════════════════╧═══════════════════╧═══════════════════╝
Query a DataFrame using logical operators
This is only supported in older versions. That is versions lower than v1.0.0
To query a DataFrame, you can specify the column to use, the logical operator (">", "<", ">=", "<=", and. "=="), and the value to compare against.
Node Browser
Copy const dfd = require ( "danfojs-node" )
let data = { "A" : [ 30 , 1 , 2 , 3 ] ,
"B" : [ 34 , 4 , 5 , 6 ] ,
"C" : [ 20 , 20 , 30 , 40 ]}
let cols = [ "A" , "B" , "C" ]
let df = new dfd .DataFrame (data , { columns : cols })
df .print () //before query
let query_df = df .query ({ "column" : "B" , "is" : ">" , "to" : 5 })
query_df .print () //after query
Output
Copy //before query
╔═══╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B │ C ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ 1 │ 2 │ 3 ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 1 │ 4 │ 5 │ 6 ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 2 │ 20 │ 30 │ 40 ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 3 │ 39 │ 89 │ 78 ║
╚═══╧═══════════════════╧═══════════════════╧═══════════════════╝
//after query
╔═══╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B │ C ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 2 │ 20 │ 30 │ 40 ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 3 │ 39 │ 89 │ 78 ║
╚═══╧═══════════════════╧═══════════════════╧═══════════════════╝
Query by a string column in a DataFrame
This is only supported in older versions. That is versions lower than v1.0.0
The query method also works on string columns.
Node Browser
Copy const dfd = require ( "danfojs-node" )
let data = { "A" : [ "Ng" , "Yu" , "Mo" , "Ng" ] ,
"B" : [ 34 , 4 , 5 , 6 ] ,
"C" : [ 20 , 20 , 30 , 40 ]}
let df = new dfd .DataFrame (data)
df .print ()
let query_df = df .query ({ column : "A" , is : "==" , to : "Ng" })
query_df .print () //after query
Output
Copy ╔═══╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B │ C ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ Ng │ 34 │ 20 ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 1 │ Yu │ 4 │ 20 ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 2 │ Mo │ 5 │ 30 ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 3 │ Ng │ 6 │ 40 ║
╚═══╧═══════════════════╧═══════════════════╧═══════════════════╝
//after query
╔═══╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B │ C ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ Ng │ 34 │ 20 ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 3 │ Ng │ 6 │ 40 ║
╚═══╧═══════════════════╧═══════════════════╧═══════════════════╝